제로샷 러닝 (ZSL) 은 모델이 이전에 접해보지 못한 객체 또는 개념을 인식하고 분류하도록 학습하는 기계 학습 기법입니다.모델이 식별해야 하는 모든 클래스에 대해 레이블이 지정된 예제를 요구하는 기존의 머신 러닝 접근 방식과 달리, 제로샷 러닝을 사용하면 모델이 관련 클래스의 지식을 활용하거나 속성, 설명 또는 의미 관계와 같은 보조 정보를 사용하여 보이지 않는 클래스에 대해 예측할 수 있습니다.제로샷 러닝의 의미는 추가 학습 데이터 없이 지식을 보이지 않는 새로운 작업이나 범주로 일반화할 수 있는 능력과 밀접하게 연관되어 있습니다.
인공 지능 (AI) 의 관점에서 제로샷 학습의 의미는 모델이 예측할 것으로 예상되는 각 클래스에 대해 일반적으로 레이블이 지정된 다수의 예제를 필요로 하는 기존 지도 학습의 한계를 극복하는 데 초점을 맞추고 있다는 것입니다.제로샷 학습에서는 모델이 보조 정보를 대신 사용하여 보이는 클래스와 보이지 않는 클래스 간의 격차를 해소합니다.이러한 보조 정보는 클래스의 특성 또는 관계를 설명하는 텍스트 설명, 속성 벡터 또는 시맨틱 임베딩과 같은 다양한 형태로 제공될 수 있습니다.
예를 들어 모델이 다양한 유형의 동물을 인식하도록 훈련된 경우 개, 고양이, 말과 같은 일반적인 동물과 관련된 특징을 학습했을 수 있습니다.제로샷 학습 시나리오에서는 모델에 얼룩말과 같이 이전에 본 적이 없는 새로운 동물을 식별하도록 요청할 수 있습니다.이 모델은 얼룩말의 라벨이 붙은 예시 대신 “줄무늬”, “말”, “흑백”과 같은 얼룩말에 대한 설명 정보를 사용하여 얼룩말이 뚜렷한 줄무늬를 가진 말과 유사하다는 것을 추론할 수 있습니다. 따라서 정확한 추정을 통해 얼룩말을 정확하게 식별할 수 있습니다.
제로샷 학습은 일반적으로 다음과 같은 기법에 의존합니다.
속성 기반 모델: 이러한 모델은 보이는 클래스와 보이지 않는 클래스를 모두 설명하는 속성 (예: 색상, 모양, 크기) 을 사용합니다.모델은 이러한 속성이 보이는 클래스의 시각적 특징과 어떤 관련이 있는지 학습함으로써 해당 속성을 기반으로 보이지 않는 클래스의 존재를 추론할 수 있습니다.
시맨틱 임베딩: 시맨틱 임베딩은 클래스의 관계나 의미를 기반으로 클래스를 연속 벡터 공간으로 표현하는 것을 포함합니다.이 접근 방식에서는 자연어 처리 (NLP) 모델이나 지식 그래프의 단어 임베딩을 사용하여 보이지 않는 클래스를 보이는 클래스와 연관시킬 수 있습니다.
전이 학습: 제로샷 학습에만 국한되는 것은 아니지만 ZSL 모델을 통해 전이 학습을 활용하여 관련 작업 또는 영역의 지식을 이전할 수 있으므로 보이지 않는 클래스를 인식하는 데 도움이 됩니다.
제로샷 학습의 주요 이점 중 하나는 레이블이 지정된 데이터의 필요성을 크게 줄일 수 있다는 것입니다.많은 실제 시나리오에서 가능한 모든 범주에 대해 레이블이 지정된 데이터를 수집하는 것은 비현실적이거나 불가능할 수 있습니다.ZSL은 기존 지식을 바탕으로 모델을 일반화할 수 있도록 하여 이 문제를 해결하므로 새로운 범주나 작업이 자주 등장하는 역동적인 환경에서 특히 유용합니다.
제로샷 러닝은 특정 범주에 대해 레이블이 지정된 데이터가 부족하거나 사용할 수 없는 시나리오를 처리하기 위한 실용적인 솔루션을 제공하기 때문에 기업에 특히 중요합니다.이러한 기능을 통해 비용을 절감하고 AI 모델을 더 빠르게 배포할 수 있으며 광범위한 재교육 없이도 새로운 과제에 적응할 수 있습니다.
예를 들어 전자 상거래에서는 제로샷 러닝을 사용하여 이전에 모델에서 볼 수 없었던 신제품을 분류할 수 있습니다.모델은 이러한 신제품의 특성과 설명을 이해함으로써 제품을 정확하게 분류할 수 있어 수동 라벨링 없이도 검색 기능, 권장 사항 및 재고 관리를 개선할 수 있습니다.
사이버 보안에서는 제로샷 학습을 사용하여 교육 데이터에 포함되지 않은 새로운 유형의 위협이나 이상 현상을 탐지할 수 있습니다.이를 통해 보안 시스템은 알려진 위협과의 유사성을 기반으로 잠재적 위험을 식별하거나 보안 침해에 대한 설명이 포함된 지표를 통해 진화하는 위협에 미리 대응할 수 있습니다.
또한 제로샷 학습은 잠재적인 범주나 개념의 수가 방대하고 지속적으로 증가하고 있는 자연어 처리 및 컴퓨터 비전과 같은 분야에서 중요합니다.ZSL은 이러한 분야에서 사업을 운영하는 기업을 위해 인간의 개입을 최소화하면서 다양한 작업을 처리할 수 있는 보다 유연하고 적응력이 뛰어난 AI 시스템을 구축할 수 있는 방법을 제공합니다.
마지막으로, 제로샷 러닝은 모델이 관련 클래스의 보조 정보를 활용하여 보이지 않는 물체나 개념을 인식하고 분류할 수 있도록 하는 기계 학습 기법입니다.제로샷 러닝이 기업에 미치는 의미는 레이블이 지정된 데이터의 필요성을 줄이고, 새로운 작업에 더 빠르게 적응할 수 있게 하며, 다양한 애플리케이션에서 AI 시스템의 확장성과 유연성을 개선할 수 있다는 것입니다.기업은 제로샷 학습을 채택함으로써 AI 기능을 향상시켜 동적이고 데이터가 제한된 환경에서 운영 효율성을 높이고 성과를 높일 수 있습니다.
Sapien의 데이터 라벨링 및 데이터 수집 서비스가 음성-텍스트 AI 모델을 어떻게 발전시킬 수 있는지 알아보려면 당사 팀과 상담을 예약하세요.