발전을 위한 기록

[IT/AI] 비지도 학습(Unsupervised Learning) - 정의, 유형 본문

IT/AI

[IT/AI] 비지도 학습(Unsupervised Learning) - 정의, 유형

릴릴2 2024. 1. 22. 22:20

1. 비지도 학습이란?

비지도 학습은 머신러닝의 한 방법으로, 컴퓨터가 레이블(답)이나 명확한 지시 없이 스스로 데이터를 이해하고 학습하는 과정을 말합니다. 데이터에 숨겨진 패턴이나 구조를 찾는 것을 목표로 합니다.

 


2. 비지도 학습의 유형

2-1. 클러스터링 (Clustering) 

클러스터링은 비지도 학습에서 가장 널리 사용되는 방법 중 하나입니다. 이 방식은비슷한 특성이나 패턴을 가진 데이터를 그룹으로 묶습니다.대표적인 클러스터링 알고리즘으로는 K-평균 클러스터링과 계층적 클러스터링이 있으며, 이들은 데이터를 효과적으로 분류하는 데 사용됩니다.


2-2. 연관성 (Association)

연관성 알고리즘은 데이터 내에서 자주 발생하는 패턴, 특징 혹은 연관성을 찾아냅니다. 예를 들어, 슈퍼마켓의 거래 데이터를 분석하여 어떤 상품들이 함께 구매되는 경향이 있는지 알아낼 수 있습니다. 이 정보는 상품 배치, 재고 관리, 교차 판매 전략 등에 활용됩니다. Apriori 알고리즘은 이 유형의 대표적인 예로, 상품 간의 구매 연관성을 분석하는 데 주로 사용됩니다.


2-3. 차원 축소 (Dimensionality Reduction)

데이터가 매우 복잡하고 다양한 속성을 가질 때, 데이터를 더 단순하고 관리하기 쉬운 형태로 변환하는 데 도움을 줍니다. 또한 중요한 정보를 최대한 보존하면서 데이터의 복잡성을 줄입니다. 예를 들어, 수백 가지의 속성을 가진 대규모 데이터 세트를 더 적은 수의 차원으로 요약하여 분석가가 쉽게 이해하고 처리할 수 있도록 합니다. 주요 성분 분석(PCA)은 대표적인 차원 축소 방법으로, 데이터의 중요한 특징을 유지하며 차원을 축소합니다.


2-4.이상 탐지(Anomaly Detection)

이상 탐지는 데이터 세트에서 비정상적이거나 예외적인 패턴을 식별하는 데 사용됩니다. 이 방법은 사기 탐지, 시스템 오류 감지, 건강 모니터링 등에 널리 사용됩니다. 예를 들어, 은행 거래에서 평소와 다른 이상한 패턴을 찾아내어 사기를 예방하는 데 도움을 줄 수 있습니다. 이상 탐지는 또한 데이터 정리 과정에서 오류나 이상치를 찾아내는 데도 중요한 역할을 합니다.


 

2-5.신경망(Neural Networks)

특정 신경망 구조, 특히 오토인코더나 생성적 적대 신경망(GANs)은 비지도 학습 방식으로 사용됩니다. 신경망은 훈련 데이터를 기반으로 새로운 데이터를 생성하거나 재구성하는 방법을 학습합니다. 예를 들어, 오토인코더는 이미지의 노이즈를 제거하거나 압축하는 데 사용되며, GANs는 실제와 유사한 가상 이미지를 생성하는 데 사용됩니다. 이러한 기술은 창의적인 콘텐츠 제작, 이미지 복원, 새로운 데이터 세트 생성 등 다양한 분야에 활용됩니다.

728x90