https://opentutorials.org/course/4570
5. 표를 다루는 도구 '판다스'
표에서의 변수
관측치에 따라 값이 변하는 것 ==> Column
프로그래밍에서 말하는 변수와 관점에서 미묘한 차이가 있으니 잘 구분해야 함.
- 독립변수: 원인이 되는 변수
- 종속변수: 결과가 되는 변수
지도학습은 독립변수와 종속변수를 구분하는 것에서 시작!
pandas : 표를 다루는 데 유용한 기능 제공해주는 라이브러리
6. 표를 다루는 도구 '판다스'(실습)
실습을 통해 배울 도구들
- 파일 읽어오기
- 모양 확인하기
- 칼럼 선택하기
- 칼럼 이름 출력하기
- 맨 위 5개 관측치 출력하기
csv : ,(콤마)를 이용해서 칼럼들을 구분해 준 데이터. 엑셀로 읽으면 표의 형태로 읽어들임.
import pandas as pd
#파일들로부터 데이터 읽어오기
파일 경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
레모네이드 = pd.read_csv(파일경로)
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv'
보스턴 = pd.read_csv(파일경로)
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv'
아이리스 = pd.read_csv(파일경로)
# 데이터 모양으로 확인하기 (열-1, 칼럼)
print(레모네이드.shape) #(6,2)
print(보스턴.shape) #(506, 14)
print(아이리스.shape) #(150, 5)
# 칼럼 이름 출력
print(레모네이드.columns)
print(보스턴.columns)
print(아이리스.columns)
#독립변수와 종속변수 분리
독립 = 레모네이드[['온도']]
종속 = 레모네이드[['판매량']]
print(독립.shape, 종속.shape) #(6, 1) (6, 1)
독립 = 보스턴[['crim', 'zn', 'indus', 'chas', 'nox',
'rm', 'age', 'dis', 'rad', 'tax',
'ptratio', 'b', 'lstat']]
종속 = 보스턴[['medv']]
print(독립.shape, 종속.shape) #(506, 13) (506, 1)
독립 = 아이리스[['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭']]
종속 = 아이리스[['품종']]
print(독립.shape, 종속.shape) #(150, 4) (150, 1)
# 맨 위 5개 관측치 출력하기
레모네이드.head()
보스턴.head()
아이리스.head()
--> 이제 분리된 데이터를 가지고 모델에 데이터를 학습시키면 됨!
'스터디📖 > ML, DL' 카테고리의 다른 글
Tensorflow (python) - 10, 11, 12강 두번째 딥러닝 - 보스턴 집값 예측 (0) | 2021.08.25 |
---|---|
Tensorflow (python) - 7, 8, 9강 첫번째 딥러닝 - 레모네이드 판매 예측 (0) | 2021.08.24 |
Tensorflow (python) - 1, 2, 3, 4강 (0) | 2021.08.21 |
머신러닝 처음 시작하기(인프런) - 18강 최종 실습 - 타이타닉3 (0) | 2021.08.19 |
머신러닝 처음 시작하기(인프런) - 17강 최종실습 - 타이타닉2 (0) | 2021.08.18 |