7강 로지스틱 회귀 모델 구현
colab 런타임> TPU 로 설정
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_iris
iris = load_iris() #iris 데이터 가져오기??
print(iris.target_names) #['setosa' 'versicolor' 'virginica']
print(iris.feature_names) #['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
print(iris.data[0:5])
print(iris.target) #target data 0,1,2 는 앞에서 봤던 꽃 이름들과 매칭됨
X = iris.data
y = iris.target #꽃 종류
df = pd.DataFrame(X, columns = ['sepal_width(cm)', 'sepal_length(cm)', 'petal_width(cm)', 'petal_length(cm)'])
df.head() #5개의 행 뽑기
df = pd.DataFrame(iris.data, columns = iris.feature_names)
df['species'] = np.array([iris.target_names[i] for i in iris.target])
sns.pairplot(df, hue='species')
#3차원 이상의 데이터에서 주로 사용, 그래프로 시각화
#hue = 'species'->카테고리형 데이터가 섞여 있을 때 이걸로 카테고리 값에 따라 색상을 다르게 함
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3)
#70프로는 training data, 30프로는 test data
from sklearn.linear_model import LogisticRegression
log_r = LogisticRegression()
log_r.fit(X, y)
W, b = log_r.coef_, log_r.intercept_
print(log_r.score(X_train, y_train)) #X, y 둘 다 트레인 데이터로 훈련시켰을때의 값
print(log_r.score(X_test, y_test)) #0.97777777
** 설명 너무 빈약하고. 값자기 iris 데이터를 가져오는 데 여기에 대한 설명은 일언반구도 없다.
라이브러리에 대한 설명도 왜 이 라이브러리를 가져오는 지에 대한 설명이 모두 생략되있는데, 앞선 선형 회귀 모델 구현할 때도 생략해놓고 저번에 했던 코드랑 크게 다를 게 없으니 쉽게 따라 올 수 있다고 말하면 뭐.. 어쩌라고 ... 싶다. 마치 수업시간에 교수님 코드 뇌 빠진 채로 그냥 따라 치는 느낌이랄까. 돈 주고 봤으면 정말 억울했을 강의다.
그냥 정말 대충 감만 잡는다는 느낌으로 가볍게 보고 있기는 한덴, 볼수록 화가 나는 건 어쩔 수 없다.....
'스터디📖 > ML, DL' 카테고리의 다른 글
머신러닝 처음 시작하기(인프런) - 9강 의사 결정 나무 구현 (0) | 2021.08.06 |
---|---|
머신러닝 처음 시작하기(인프런) - 8강 의사 결정 나무 (0) | 2021.08.04 |
머신러닝 처음 시작하기(인프런) - 06강 로지스틱 회귀 (0) | 2021.08.02 |
머신러닝 처음 시작하기(인프런) - 05강 선형 회귀 모델 구현 / colab 설명 (0) | 2021.07.31 |
머신러닝 처음 시작하기(인프런) - 04강 다중 선형 회귀 (0) | 2021.07.29 |