8강 의사 결정 나무
결정트리
- 분류와 회귀 모두 가능한 지도 학습 모델
- Yes or No 질문들로 이어가며 학습
👉 즉, 특정 질문에 따라 데이터를 구분하는 학습 - 한번의 분기떄마다 두 개로 구분
- 질문이나 정답의 네모 상자 : Node
- 맨 처음 분류 기준: Root Node
- 맨 마지막 분류 기준: Terminal / Leaf Node
결정 트리 프로세스
- 질문들을 기준으로 나눔
- 나뉜 범주에서 또 다시 질문들을 기준으로 나눔(다만, 지나치게 나누면 오버피팅 가능성)
-> 이를 막기 위한 방법: 가지치기
가지치기 종류:
- 사전 가지치기(pre-pruning) 트리 생성을 일찍 중단. 트리의 최대 깊이 혹은 리프 노드의 최대 갯수 제한. 노드가 분할하기 위한 포인트의 최소한계 지정.
- 사후 가지치기(post-pruning) 트리를 만든 후에 데이터 포인트가 적은 노드를 삭제하거나 병합
특성 중요도: 트리를 만드는 결정에 각 특성이 얼마나 중요한지를 보는 것. 0과 1 사이의 숫자. 특성 중요도의 전체 합은 1이 됨. ??^^ 뭐라는 거야 진짜ㅠㅠ
결정 트리 장점
알고리즘이 직관적
룰이 매우 뚜렷하며, 규칙 노드와 리프 노드를 알기 쉽고 규칙 파악 용이
전처리 같은 작업들이 덜 필요
++이외에 장점 더 설명해줬는데.. 그냥 입으로 후루룩 설명.. 수업 시간 발표보다도 퀄리티가 떨어진다..
단점
과적합 가능성 높음. 모델의 유연성 떨어짐. 일반성 부족. 상대적으로 정확도 떨어짐.
'스터디📖 > ML, DL' 카테고리의 다른 글
머신러닝 처음 시작하기(인프런) - 10강 랜덤 포레스트 (0) | 2021.08.09 |
---|---|
머신러닝 처음 시작하기(인프런) - 9강 의사 결정 나무 구현 (0) | 2021.08.06 |
머신러닝 처음 시작하기(인프런) - 7강 로지스틱 회귀 모델 구현 (0) | 2021.08.03 |
머신러닝 처음 시작하기(인프런) - 06강 로지스틱 회귀 (0) | 2021.08.02 |
머신러닝 처음 시작하기(인프런) - 05강 선형 회귀 모델 구현 / colab 설명 (0) | 2021.07.31 |