Study

Excel _ chapter 1 : 이론

yeah민하 2023. 11. 30. 10:05
반응형

1. EDA 

 

2. 비지도학습 

 

머신러닝과 딥러닝의 차이는 ? 

 

정형데이터와 비정형 데이터를 사용한다는 차이점이 있다 ! 

 

인공지능이 머신러닝을 감싸고,

머신러닝이 딥러닝을 감싸고 있다. 

 

지도학습은 답이 있고, 

비지도학습은 답이 있다! 

 

즉, 문제푸는게 지도학습이라고 볼 수 있다. 

예로는 이사람이 vip인지 아닌지를 판단하는 학습이 있을 수 있다. 

 

엑셀데이터를 예로 볼때 오른쪽 맨 위에 답이 있다 

즉, 엑셀데이터는 지도학습으로 나온 데이터라고 볼 수 있는 것 ! 


반면에,

 

비지도 학습은 고객 데이터를 분류하는 경우가 예가 될 수 있다. 

A그룹은 이러한 특징, 

B그룹은 이러한 특징을 가지고 있다고 분석할 수 있다. 

 

비지도 학습 중 가장 대표적인 K-means에 대해 알아보자. 

 

평균 지점을 기준으로 해서 가까운 집단끼리 그룹을 만드는 알고리즘이다. 

 

다음은 K-means 알고리즘 계산 순서이다. 

 

그룹수(k)지정 > 각 그룹마다 임의의 중심점 지정 > [ 데이터와 각 그룹 중심점간의 거리 계산 > 데이터와 가장 가까운 그룹을 결정 > 결정된 그룹별 중심점 계산 ] 반복 

 

다음은 KNN 알고리즘이다. 

 

가격을 예측하고 싶을 때, 집단의 평균값을 구하게 되면 한 가격을 

예측할 수 있을 것이다. 

 

이해가 안되는데 ? ? 이따 다시 질문. .

 

전처리는 두개로 볼 수 있는데, 

1. 안하면 오류 발생 or 2. 해주면 좋음 

 

1.

결측치 처리 

차원일치

카테고리컬 데이터의 원핫인코딩 

NLP 딥러닝할 때 토큰화 및 인코딩 

 

2.

거리기반 알고리즘의 정규화 

거리기반 아닌 알고리즘의 정규화

데이터 축소 : 과적합 방지 

이상치 처리 

CNN의 이미지 전처리 

 

 

 

 

 

 

 

반응형

'Study' 카테고리의 다른 글

Chapter 2 _ 파이썬의 의의 + 작성방법  (0) 2023.12.01
Excel _ chapter2 EDA : 박스플롯과 이상값  (0) 2023.11.30
Python 제어문 - 반복문 - list / for문  (1) 2023.11.06
조건문 - 중첩  (0) 2023.11.06
조건문 - elif  (0) 2023.11.06