스터디📖/ML, DL
머신러닝 처음 시작하기(인프런) - 16강 최종실습 - 타이타닉1
호프
2021. 8. 17. 20:21
머신러닝 처음 시작하기 (기초 원리 + 초급 실습) - 인프런 | 강의
머신러닝을 처음 접하는 사람들을 대상으로 기초적인 머신러닝 이론을 간략하게 다룬 머신러닝 기초 강의입니다., 그것이 알고 싶다!요새 핫한 머신러닝 🤖 [사진] 🗒 강의소개 (이 강의는 강
www.inflearn.com
최종실습 - 타이타닉1
kaggle -> titanic 데이터 이용
타이타닉에서 사람들이 살아남는지 살아남지 못하는 지 예측하는 것.
from google.colab import files
uploaded = files.upload() #코랩에서 파일 불러오는 방식. 파일 선택
import pandas as pd
import io
df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8'))) #train dataset 불러오고 dataframe으로 변환
train = df
print(train) #train 데이터 확인
df0 = pd.read_csv(io.StringIO(uploaded['test.csv'].decode('utf-8')))
test = df0
print(test) #test 데이터 확인
train.info() #train 데이터 정보 출력
test.info() #test 데이터 정보 출력
train.head() #5개 행 데이터 확인
test.head()
train.describe(include='all') #더 자세한 정보 확인 가능
print(train.columns) #train data feature 확인
print(pd.isnull(train).sum()) #널 값(결측치) 확인
print(pd.isnull(test).sum())