14강 train valid test 데이터 나누기
데이터셋 나누기 Train / Test set
- 딥러닝 : training / validation / test
- 머신러닝 : training / test
- training과 validation을 가지고 훈련을 한 후 모델을 만들어 test 데이터로 test를 함.
- validation = train 과정에서 모델이 잘 학습이 되는 지 알기 위해 쓰임. 중간중간 평가하는 데이터
교차검증
모델을 평가하는 방법 중 하나
test 데이터가 적을 때 문제점을 해결하기 위한 것.
K-Fold
- 데이터를 K개로 쪼갠 후 하나는 검증 데이터, 나머지는 훈련 데이터로 만들어서 성능을 구함
- 이 과정을 K번 반복함
- K번의 성능의 평균을 구함
모델 성능 평가 지표
실제정답 / 머신러닝 모델의 답 | True | False |
True | a | b |
False | c | d |
Precision(정밀도) = a / (a+c)
- 모델이 true로 예측한 값들 중에서 알맞게 예측한 비율
재현율 = a / (a+b)
- true로 잘 예측한 비율(?)
Accuracy = (a+d) / (a+b+c+d)
- 전체 클래스 중 제대로 잘 예측한 비율
F1 Score(정밀도와 재현도의 조화평균) = 2*(정밀도*재현율) / (정밀도+재현율)
'스터디📖 > ML, DL' 카테고리의 다른 글
머신러닝 처음 시작하기(인프런) - 16강 최종실습 - 타이타닉1 (0) | 2021.08.17 |
---|---|
머신러닝 처음 시작하기(인프런) - 15강 데이터 전처리 (0) | 2021.08.16 |
머신러닝 처음 시작하기(인프런) - 13강 knn 구현 (0) | 2021.08.12 |
머신러닝 처음 시작하기(인프런) - 12강 KNN (0) | 2021.08.11 |
머신러닝 처음 시작하기(인프런) - 11강 랜덤 포레스트 구현 (0) | 2021.08.10 |