최종 업데이트:
3.23.2025

비지도 학습

비지도 학습은 레이블이 지정되지 않은 데이터를 대상으로 알고리즘을 학습하는 일종의 기계 학습입니다. 즉, 데이터에 사전 정의된 레이블이나 범주가 없습니다.비지도 학습의 목적은 명시적인 지침 없이 데이터 내의 패턴, 구조 또는 관계를 식별하는 것입니다.이 접근 방식은 데이터의 기본 구조를 미리 알 수 없는 클러스터링, 차원 축소, 변칙 탐지와 같은 작업에 자주 사용됩니다.

자세한 설명

비지도 학습에서 알고리즘은 레이블이 지정된 결과 없이 입력 데이터로부터 패턴과 구조를 학습하려고 시도합니다.알려진 입력-출력 쌍이 있는 데이터세트에서 모델을 학습시키는 지도 학습과 달리, 비지도 학습은 데이터를 탐색하고 숨겨진 구조나 패턴을 찾는 데 중점을 둡니다.

비지도 학습의 주요 측면은 다음과 같습니다.

클러스터링: 클러스터링은 비지도 학습에서 가장 일반적인 작업 중 하나입니다.알고리즘은 유사한 데이터 포인트를 특징에 따라 그룹화하여 클러스터를 형성합니다.각 클러스터는 특정 특성을 공유하는 데이터 포인트 그룹을 나타냅니다.널리 사용되는 클러스터링 알고리즘은 다음과 같습니다.

K-평균 군집화: 이 알고리즘은 데이터를 지정된 개수의 군집으로 분할하여 각 군집 내의 분산을 최소화합니다.

계층적 클러스터링: 이 접근 방식은 개별 데이터 요소로 시작하여 이를 더 큰 클러스터로 병합 (집계) 하거나 하나의 큰 클러스터에서 시작하여 더 작은 클러스터로 분할 (분할) 하여 트리와 같은 클러스터 구조를 구축합니다.

DBSCAN (노이즈가 있는 애플리케이션의 밀도 기반 공간 클러스터링): 이 알고리즘은 데이터 포인트의 밀도를 기반으로 클러스터를 형성하여 임의 형태의 클러스터와 노이즈 (이상값) 를 식별할 수 있습니다.

차원 축소: 차원 축소 기법은 기본 구조를 최대한 보존하면서 데이터셋의 특징 또는 차원의 수를 줄이는 데 사용됩니다.이는 계산 복잡성을 줄이고 차원의 저주를 완화하여 고차원 데이터를 시각화하고 머신 러닝 모델의 성능을 개선하는 데 유용합니다.일반적인 차원 축소 기법에는 다음이 포함됩니다.

주성분 분석 (PCA): PCA는 데이터에서 가장 큰 변동을 포착하는 방향 (주성분) 을 식별하여 데이터를 저차원 공간으로 변환합니다.

T-분산 스토캐스틱 이웃 임베딩 (t-SNE): t-SNE는 데이터 포인트 간의 관계를 보존하면서 고차원 데이터를 저차원 공간 (주로 2D 또는 3D) 에 매핑하여 시각화하는 데 사용되는 기법입니다.

이상 탐지: 비지도 학습은 예외 항목 탐지에도 사용됩니다. 여기서 목표는 표준에서 크게 벗어나는 데이터 포인트를 식별하는 것입니다.이러한 이상 현상은 상황에 따라 사기, 네트워크 침입 또는 제품 결함을 나타낼 수 있습니다.이상 탐지 알고리즘은 데이터의 정상적인 동작을 학습하고 이 패턴에 맞지 않는 데이터 요소에 플래그를 지정합니다.

연관 규칙 학습: 연관 규칙 학습은 대규모 데이터셋에서 변수 간의 흥미로운 관계를 식별합니다.이 기법은 일반적으로 마켓바스켓 분석에서 함께 구매하는 상품 간의 연관성을 파악하는 데 사용됩니다.Apriori 알고리즘은 채굴 연관 규칙을 위한 가장 잘 알려진 방법 중 하나입니다.

비지도 학습의 응용: 비지도 학습은 다음을 포함하여 다양한 산업 전반에 걸쳐 광범위하게 적용됩니다.

고객 세분화: 기업은 클러스터링 알고리즘을 사용하여 고객을 구매 행동이 유사한 그룹으로 분류하여 보다 타겟팅된 마케팅 전략을 수립할 수 있습니다.

이상 탐지: 금융에서는 표준과 다른 패턴을 식별하여 사기 거래를 탐지하는 데 비지도 학습을 사용합니다.

추천 시스템: 비지도 학습은 사용자 행동 패턴을 식별하는 데 도움이 되므로 명시적인 피드백 없이 개인화된 추천이 가능합니다.

이미지 압축: PCA와 같은 차원 축소 기술을 사용하여 필수 정보를 보존하면서 픽셀 수를 줄임으로써 이미지를 압축할 수 있습니다.

비지도 학습이 기업에 중요한 이유는 무엇입니까?

비지도 학습은 풍부하지만 분석하기 어려운 레이블이 지정되지 않은 데이터에서 귀중한 통찰력을 추출할 수 있게 해주기 때문에 기업에 중요합니다.기업은 데이터 내의 숨겨진 패턴과 관계를 발견함으로써 효율성을 높이고 고객 경험을 개선하며 혁신을 주도하는 데이터 기반 결정을 내릴 수 있습니다.

예를 들어 소매업에서는 비지도 학습을 통해 다양한 고객 세그먼트를 식별할 수 있어 기업이 특정 그룹에 맞게 마케팅 활동 및 제품 제공을 조정할 수 있습니다.사이버 보안에서 이상 탐지 알고리즘은 보안 침해를 나타낼 수 있는 비정상적인 행동을 탐지하여 잠재적 위협에 신속하게 대응할 수 있도록 합니다.

이와 함께 비지도 학습은 레이블이 지정된 데이터 세트를 필요로 하지 않기 때문에 데이터 레이블링과 관련된 비용을 줄일 수 있습니다.이는 데이터에 레이블을 지정하는 데 비용이 많이 들거나 시간이 많이 걸리거나 실용적이지 않은 시나리오에서 특히 유용합니다.

마지막으로, 비지도 학습은 레이블이 지정되지 않은 데이터에서 패턴과 구조를 찾는 기계 학습 접근 방식입니다.기업의 경우 대량의 데이터를 분석하고, 숨겨진 통찰력을 발견하고, 정보에 입각한 결정을 내려 운영, 고객 참여 및 전반적인 비즈니스 성과를 개선할 수 있는 방법을 제공합니다.

Volume:
5400
Keyword Difficulty:
78

데이터 라벨링 작동 방식 보기

Sapien의 데이터 라벨링 및 데이터 수집 서비스가 음성-텍스트 AI 모델을 어떻게 발전시킬 수 있는지 알아보려면 당사 팀과 상담을 예약하세요.