차원 축소를 공부하다 보면 거의 반드시 만나게 되는 이름이 있습니다.바로 PCA, t-SNE, UMAP입니다.셋 다 데이터를 더 낮은 차원으로 줄여서 보기 쉽게 만든다는 점은 비슷하지만, 실제 목적과 성격은 꽤 다릅니다.가장 먼저 큰 그림부터 잡으면 이렇습니다.PCA는 분산을 최대한 보존하는 선형 차원 축소에 가깝고, t-SNE는 고차원 데이터 시각화에 특화된 비선형 임베딩에 가깝고, UMAP은 로컬 구조와 어느 정도의 전역 구조 균형을 조절할 수 있는 비선형 임베딩에 더 가깝습니다. 쉽게 말하면 PCA는 정보를 최대한 유지하며 압축하는 느낌, t-SNE는 보이기 좋게 군집을 펼쳐주는 느낌, UMAP은 시각화와 구조 보존 사이의 균형을 잡아주는 느낌으로 이해하면 꽤 편합니다.#PCA #tSNE #UMAP..