8-1. 차원 축소(Dimensionality Reduction)
2021. 5. 12. 18:35ㆍMachine Learning
예측 모델을 훈련시킬 때, 훈련시킬 데이터셋이 너무 고차원이라면(특성 수가 과도하게 많다면)
훈련 시간이 지나치게 길어지거나 과대적합의 위험이 존재한다.
이 훈련 세트의 특성 수를 줄임에도 해당 데이터셋의 특질을 잘 파악할 수 있다면
특성의 수를 줄이는 것이 좋은 방법일 것이다. 이를 차원 축소(Dimensionality Reduction)라고 한다.
투영(Projection)
투영(Projection)은 차원 축소의 한가지 방법이다.
대부분의 실전 문제에서는 훈련 샘플은 모든 차원에 균일하게 퍼져있지 않고
고차원 공간 안의 저차원 부분공간(subspace)에 놓여있다. 투영은 이러한 고차원 공간 안에서 데이터의 양상을 최대한
보존하면서 차원을 축소시키는 방법이다.
매니폴드 학습(Manifold Learning)
매니폴드 학습(Manifold Learning)은 고차원 공간인 n차원 공간 안에서의 국부적 d차원 초평면(n>d)으로
표현될 수 있는 d차원 매니폴드를 모델링하는 기법이다.
이는 고차원 데이터셋이 저차원의 매니폴드에 가깝게 놓여있다는 매니폴드 가정(가설)에 근거한다.
'Machine Learning' 카테고리의 다른 글
9-1. 군집(Clustering) - K평균 클러스터링(1) (0) | 2021.05.20 |
---|---|
8-2. PCA(Principal Component Analysis) (1) | 2021.05.12 |
7-5. 부스팅(Boosting) - 그레이디언트 부스팅(Gradient Boosting) (0) | 2021.05.12 |
7-4. 부스팅(Boosting) - 에이다부스트(Adaboost) (0) | 2021.05.12 |
7-3. 랜덤 포레스트(Random Forest) (0) | 2021.05.12 |