스터디📖/ML, DL

머신러닝 처음 시작하기(인프런) - 7강 로지스틱 회귀 모델 구현

호프 2021. 8. 3. 21:30

https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%B2%98%EC%9D%8C-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/dashboard

 

머신러닝 처음 시작하기 (기초 원리 + 초급 실습) - 인프런 | 강의

머신러닝을 처음 접하는 사람들을 대상으로 기초적인 머신러닝 이론을 간략하게 다룬 머신러닝 기초 강의입니다., 그것이 알고 싶다!요새 핫한 머신러닝 🤖 [사진] 🗒 강의소개 (이 강의는 강

www.inflearn.com

7강 로지스틱 회귀 모델 구현

colab 런타임> TPU 로 설정

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_iris

iris = load_iris() #iris 데이터 가져오기??
print(iris.target_names) #['setosa' 'versicolor' 'virginica']
print(iris.feature_names) #['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
print(iris.data[0:5])
print(iris.target) #target data 0,1,2 는 앞에서 봤던 꽃 이름들과 매칭됨

X = iris.data
y = iris.target #꽃 종류
df = pd.DataFrame(X, columns = ['sepal_width(cm)', 'sepal_length(cm)', 'petal_width(cm)', 'petal_length(cm)'])
df.head() #5개의 행 뽑기

df = pd.DataFrame(iris.data, columns = iris.feature_names)
df['species'] = np.array([iris.target_names[i] for i in iris.target])

sns.pairplot(df, hue='species') 
#3차원 이상의 데이터에서 주로 사용, 그래프로 시각화
#hue = 'species'->카테고리형 데이터가 섞여 있을 때 이걸로 카테고리 값에 따라 색상을 다르게 함

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3)
#70프로는 training data, 30프로는 test data

from sklearn.linear_model import LogisticRegression
log_r = LogisticRegression()
log_r.fit(X, y)
W, b = log_r.coef_, log_r.intercept_

print(log_r.score(X_train, y_train)) #X, y 둘 다 트레인 데이터로 훈련시켰을때의 값
print(log_r.score(X_test, y_test)) #0.97777777

 

** 설명 너무 빈약하고. 값자기 iris 데이터를 가져오는 데 여기에 대한 설명은 일언반구도 없다.

라이브러리에 대한 설명도 왜 이 라이브러리를 가져오는 지에 대한 설명이 모두 생략되있는데, 앞선 선형 회귀 모델 구현할 때도 생략해놓고 저번에 했던 코드랑 크게 다를 게 없으니 쉽게 따라 올 수 있다고 말하면 뭐.. 어쩌라고 ... 싶다. 마치 수업시간에 교수님 코드 뇌 빠진 채로 그냥 따라 치는 느낌이랄까. 돈 주고 봤으면 정말 억울했을 강의다.

그냥 정말 대충 감만 잡는다는 느낌으로 가볍게 보고 있기는 한덴, 볼수록 화가 나는 건 어쩔 수 없다.....