1. EDA
2. 비지도학습
머신러닝과 딥러닝의 차이는 ?
정형데이터와 비정형 데이터를 사용한다는 차이점이 있다 !
인공지능이 머신러닝을 감싸고,
머신러닝이 딥러닝을 감싸고 있다.
지도학습은 답이 있고,
비지도학습은 답이 있다!
즉, 문제푸는게 지도학습이라고 볼 수 있다.
예로는 이사람이 vip인지 아닌지를 판단하는 학습이 있을 수 있다.
엑셀데이터를 예로 볼때 오른쪽 맨 위에 답이 있다
즉, 엑셀데이터는 지도학습으로 나온 데이터라고 볼 수 있는 것 !
반면에,
비지도 학습은 고객 데이터를 분류하는 경우가 예가 될 수 있다.
A그룹은 이러한 특징,
B그룹은 이러한 특징을 가지고 있다고 분석할 수 있다.
비지도 학습 중 가장 대표적인 K-means에 대해 알아보자.
평균 지점을 기준으로 해서 가까운 집단끼리 그룹을 만드는 알고리즘이다.
다음은 K-means 알고리즘 계산 순서이다.
그룹수(k)지정 > 각 그룹마다 임의의 중심점 지정 > [ 데이터와 각 그룹 중심점간의 거리 계산 > 데이터와 가장 가까운 그룹을 결정 > 결정된 그룹별 중심점 계산 ] 반복
다음은 KNN 알고리즘이다.
가격을 예측하고 싶을 때, 집단의 평균값을 구하게 되면 한 가격을
예측할 수 있을 것이다.
이해가 안되는데 ? ? 이따 다시 질문. .
전처리는 두개로 볼 수 있는데,
1. 안하면 오류 발생 or 2. 해주면 좋음
1.
결측치 처리
차원일치
카테고리컬 데이터의 원핫인코딩
NLP 딥러닝할 때 토큰화 및 인코딩
2.
거리기반 알고리즘의 정규화
거리기반 아닌 알고리즘의 정규화
데이터 축소 : 과적합 방지
이상치 처리
CNN의 이미지 전처리
'Study' 카테고리의 다른 글
Chapter 2 _ 파이썬의 의의 + 작성방법 (0) | 2023.12.01 |
---|---|
Excel _ chapter2 EDA : 박스플롯과 이상값 (0) | 2023.11.30 |
Python 제어문 - 반복문 - list / for문 (1) | 2023.11.06 |
조건문 - 중첩 (0) | 2023.11.06 |
조건문 - elif (0) | 2023.11.06 |