12강 KNN
KNN 이란?
- 분류를 하기 위해서 주로 사용되는 모델
- KNN이란 새로운 데이터가 주어졌을 때 기존 데이터 가운데 가장 가까운 K개의 이웃 정보로 새로운 데이터를 예측하는 방법론
- K를 정하는 것이 중요
K 정하기
최근접을 몇 개까지 볼 것인가를 정한다.
표준화
거리를 재는 방법..
- distance^2 = a^2 + b^2
- 유클리드 거리법
- 맨해튼 거리 - x축과 y축을 따라서 가는 거리
장단점
게으른 모델 = 별도 모델 생성 과정 없이 각각의 관측치를 이용해서 분류 및 회귀 작업을 수행하기 때문
- 장점: 학습 데이터 내의 노이즈 값에 영향을 덜 받음. 효과적
- 단점: K와 어떤 거리 척도가 분석에 적합한 지 불문명해서 매번 데이터 척도에 맞게 임의로 정해야 함.
'스터디📖 > ML, DL' 카테고리의 다른 글
머신러닝 처음 시작하기(인프런) - 14강 train valid test 데이터 나누기 (0) | 2021.08.13 |
---|---|
머신러닝 처음 시작하기(인프런) - 13강 knn 구현 (0) | 2021.08.12 |
머신러닝 처음 시작하기(인프런) - 11강 랜덤 포레스트 구현 (0) | 2021.08.10 |
머신러닝 처음 시작하기(인프런) - 10강 랜덤 포레스트 (0) | 2021.08.09 |
머신러닝 처음 시작하기(인프런) - 9강 의사 결정 나무 구현 (0) | 2021.08.06 |