
객체 라벨링은 기계가 시각적 데이터를 이해하고 해석할 수 있도록 하는 컴퓨터 비전 시스템 개발의 중요한 구성 요소입니다.정확하고 효율적인 물체 라벨링에 대한 수요가 계속 증가함에 따라 업계의 연구자와 실무자들은 이 작업과 관련된 문제를 해결하기 위한 고급 기술을 지속적으로 모색하고 있습니다.
이 블로그 게시물에서는 객체 레이블링을 살펴보고 시맨틱 세분화, 인스턴스 세분화, 레이블 지정 프로세스를 간소화하는 액티브 러닝 적용에 대해 살펴보겠습니다.
컴퓨터 비전에서 객체 라벨링의 중요성
객체 라벨링은 교육 및 평가에서 중추적인 역할을 합니다. 컴퓨터 비전 모델, 특히 객체 감지, 시맨틱 세분화, 인스턴스 세분화와 같은 작업에 사용됩니다.객체 레이블링을 통해 이미지 또는 비디오 내 객체에 대한 정확한 주석을 제공함으로써 기계 학습 알고리즘은 다양한 객체 범주의 시각적 특성과 공간적 관계를 학습할 수 있습니다.하지만 객체 라벨링 프로세스에 어려움이 없는 것은 아닙니다.
- 정확하게 레이블링된 대량의 데이터에 대한 필요성
- 오클루전 및 오버래핑 오브젝트 처리의 복잡성
- 시간이 많이 걸리는 수동 주석의 특성
최근 연구에 따르면 80% 객체 라벨링을 포함한 데이터 준비에 소요되는 AI 프로젝트 시간은 효율적인 주석 기법의 중요성을 강조합니다.데이터 세트가 계속 증가함에 따라 컴퓨터 비전 모델의 정확성과 확장성을 유지하기 위해서는 라벨링 방법을 자동화하고 최적화하는 것이 필수적입니다.
객체 라벨링 방법
고품질 주석을 달기 위해서는 올바른 객체 라벨링 방법을 선택하는 것이 필수적입니다.다양한 접근 방식이 다양한 사용 사례에 적합하며 정확성과 효율성의 균형을 맞춥니다.
시맨틱 세그멘테이션: 픽셀 레벨 라벨링
시맨틱 분할은 이미지의 모든 픽셀에 클래스 레이블을 할당하는 것을 포함하는 객체 레이블 지정의 기본 기법입니다.경계 상자를 사용하여 객체를 식별하고 위치를 파악하는 데 초점을 맞추는 객체 감지와는 달리 시맨틱 세그멘테이션 오브젝트의 정확한 경계를 픽셀 수준에서 묘사하여 장면을 더 자세히 이해할 수 있습니다.
픽셀 레벨 라벨링 기법
픽셀 레벨 라벨링에 사용되는 몇 가지 인기 있는 기술은 다음과 같습니다.
- 완전 컨볼루션 네트워크 (FCN): 기존 CNN의 완전 연결 계층을 컨벌루션 계층으로 대체하여 밀도 높은 픽셀 단위 예측을 가능하게 합니다.
- 인코더-디코더 아키텍처 (예: U-Net, DeepLab): 입력 이미지를 다운샘플링하여 컨텍스트를 캡처하고 업샘플링하여 공간 해상도를 복구할 수 있습니다.
- 연결 건너뛰기: 세밀한 세부 정보를 보존하고 세그멘테이션 정확도를 개선합니다.
시맨틱 세그멘테이션을 위한 평가 지표
시맨틱 분할 모델의 성능을 평가하기 위해 업계에서는 몇 가지 평가 지표가 일반적으로 사용됩니다.널리 사용되는 지표 중 하나는 Jaccard 지수라고도 하는 IoU (Interction over Union) 입니다.IoU는 예측된 세그멘테이션 마스크와 그라운드 트루스 마스크 간의 중첩을 측정하여 모델의 정확도를 정량적으로 측정합니다.모든 객체 클래스의 평균 IOU를 계산하는 평균 IOU (MiOU) 가 자주 보고됩니다.
또 다른 평가 지표는 정확하게 분류된 픽셀의 백분율을 간단히 계산하는 픽셀 정확도입니다.그러나 클래스 분포가 불균형한 시나리오에서는 픽셀 정확도가 서로 다른 객체 클래스의 상대적 크기를 고려하지 않기 때문에 오해의 소지가 있을 수 있습니다.
평균 평균 정밀도 (mAP) 는 특히 다중 클래스 분할을 처리할 때 의미론적 분할 모델을 평가하는 데에도 사용됩니다. mAP은 다양한 차용증 임계값에 대한 평균 정밀도를 계산하여 모델의 성능을 종합적으로 측정합니다.
최근 arXiv의 보고서 가장 성능이 뛰어난 시맨틱 분할 모델의 평균 Intersection over Union (IoU) 점수가 지난 2년 동안 특히 도시 장면 분할 작업에서 15% 이상 향상되었다는 점을 강조합니다.
이러한 발전은 특히 복잡한 실제 응용 분야에서 모델 성능에 대한 보다 포괄적인 평가를 제공하기 위해 픽셀 정확도 및 평균 평균 정밀도 (mAP) 와 같은 다중 평가 메트릭을 사용하는 것이 중요하다는 것을 강조합니다.
인스턴스 세분화: 개별 객체 구별
시맨틱 분할은 객체 클래스의 픽셀 수준 레이블 지정에 초점을 맞추고 있는 반면, 인스턴스 분할은 한 단계 더 나아가 동일한 클래스 내에서 객체의 개별 인스턴스를 구분합니다.따라서 다음과 같은 애플리케이션에 특히 유용합니다. 자율주행 데이터 라벨링, 로봇 공학 및 의료 이미지 분석: 개별 물체의 정확한 식별 및 위치 파악이 중요합니다.
인스턴스 분할은 교통량이 많은 보행자 및 차량과 같이 겹치는 객체를 구별할 수 있게 하여 자율 주행 시스템의 정확도를 높이는 데 중요한 역할을 합니다.
마스크 R-CNN 아키텍처
인스턴스 세분화에서 가장 영향력 있는 아키텍처 중 하나는 널리 사용되는 Faster R-CNN 객체 감지 프레임워크의 확장인 Mask R-CNN입니다.Mask R-CNN에는 바운딩 박스 회귀 및 분류를 위한 기존 브랜치와 병행하여 탐지된 각 객체의 이진 분할 마스크를 예측하기 위한 추가 브랜치가 도입되었습니다.
Mask R-CNN의 주요 구성 요소는 관심 영역 (RoI) 정렬 계층으로, RoI 풀링 작업의 양자화로 인한 정렬 불량 문제를 해결합니다.RoI Align은 쌍선형 보간을 적용하여 각 RoI 빈의 정규 샘플링 위치 4곳에서 입력 특징의 정확한 값을 계산하므로 마스크 예측에 필요한 특징을 보다 정확하게 추출할 수 있습니다.
Mask R-CNN은 다양한 인스턴스 분할 벤치마크에서 최첨단 성능을 달성했으며 업계의 많은 실무자들이 즐겨 찾는 아키텍처가 되었습니다.
정확한 오브젝트 경계를 위한 폴리곤 RNN++
마스크 R-CNN이 생성되는 동안 이진 분할 마스크, 더 정확한 객체 경계가 필요한 시나리오가 있습니다.Polygon RNN++는 오브젝트 인스턴스를 밀접하게 둘러싸는 폴리곤의 꼭짓점을 예측하도록 설계된 아키텍처입니다.
Polygon RNN++는 그래프 신경망 (GNN) 을 통합하여 다각형의 꼭지점 간의 관계를 캡처함으로써 원래의 다각형 RNN 모델을 확장합니다.GNN을 사용하면 모델이 글로벌 컨텍스트를 추론하고 더 정확하고 일관된 폴리곤 예측을 생성할 수 있습니다.
Polygon RNN++은 바이너리 마스크 대신 폴리곤을 예측함으로써 객체 경계를 보다 정확하게 묘사할 수 있도록 하며, 이는 세밀한 객체 표현이 중요한 응용 분야에서 특히 유용합니다.
객체 라벨링을 위한 능동적 학습
주석 달기 머신러닝을 위한 대규모 데이터세트 객체 라벨링의 경우 시간이 많이 걸리고 리소스가 많이 소요될 수 있습니다.액티브 러닝은 라벨링을 위해 가장 유용한 샘플을 전략적으로 선택하여 주석 달기에 드는 노력을 최소화하는 것을 목표로 하는 기법입니다.액티브 러닝은 가장 불확실하거나 대표적인 샘플에 대해 주석을 반복적으로 쿼리함으로써 정확한 객체 라벨링 모델을 학습하는 데 필요한 레이블링된 데이터의 양을 크게 줄일 수 있습니다.
불확실성 기반 샘플링 전략
능동적 학습에 대한 일반적인 접근 방식 중 하나는 불확실성 기반 샘플링으로, 모델의 예측 불확실성을 사용하여 주석을 달 때 가장 유용한 정보를 제공하는 샘플을 선택합니다.불확실성은 엔트로피, 최소 신뢰 또는 마진 샘플링과 같은 다양한 기법을 사용하여 측정할 수 있습니다.
- 엔트로피 기반 샘플링: 예측된 클래스 확률에서 엔트로피가 가장 높은 표본을 선택합니다.
- 최소 신뢰도 샘플링: 신뢰도가 가장 높은 클래스에 대해 예측 확률이 가장 낮은 표본을 선택합니다.
- 마진 샘플링: 가능성이 가장 높은 두 클래스 간의 차이를 고려하여 마진이 가장 작은 표본을 선택합니다.
액티브 러닝과 객체 라벨링 파이프라인의 통합
액티브 러닝을 객체 라벨링 파이프라인에 통합하려면 신중한 설계와 구현이 필요합니다.일반적인 워크플로에는 다음 단계가 포함됩니다.
- 레이블이 지정된 작은 데이터세트에서 초기 객체 레이블 지정 모델을 학습시킵니다.
- 레이블이 지정되지 않은 대규모 데이터 풀에 모델을 적용하고 각 샘플의 불확실성 점수를 계산합니다.
- 선택한 불확실성 기반 샘플링 전략을 기반으로 가장 유용한 샘플을 선택합니다.
- 인간 주석자에게 선택한 샘플에 대한 주석을 요청합니다.
- 새로 레이블링된 샘플을 훈련 데이터세트에 추가하고 모델을 다시 훈련합니다.
- 원하는 성능 수준에 도달하거나 라벨 제작 예산이 소진될 때까지 2~5단계를 반복합니다.
액티브 러닝은 가장 많은 정보를 제공하는 샘플로 모델을 반복적으로 개선함으로써 인간의 주석 작업을 효율적으로 활용하고 객체 라벨링 모델의 통합을 가속화합니다.
컴퓨터 비전을 위한 기본 데이터 레이블링 단계
개체 레이블링은 컴퓨터 비전의 기본 작업이며 정확하고 효율적인 레이블링 기술의 개발은 해당 분야의 발전에 매우 중요합니다.이 블로그 게시물에서는 의미론적 분할, 인스턴스 분할, 능동적 학습 적용 등 객체 레이블링의 고급 기술을 살펴보았습니다.
의 시맨틱 세분화 데이터 레이블링 및 주석 완전 컨볼루션 네트워크 및 인코더-디코더 아키텍처와 같은 기술을 사용하여 픽셀 레벨 레이블링에 중점을 둡니다.인스턴스 세분화는 Mask R-CNN 및 Polygon RNN+와 같은 아키텍처를 중심으로 개별 객체 인스턴스를 구별함으로써 한 단계 더 발전시킵니다.
능동적 학습은 레이블링에 가장 유용한 샘플을 전략적으로 선택하여 객체 레이블링의 주석 부담을 줄이는 강력한 접근 방식입니다.액티브 러닝을 객체 라벨링 파이프라인에 통합함으로써 실무자는 라벨링 프로세스의 효율성과 확장성을 크게 개선할 수 있습니다.
Sapien으로 정확한 객체 라벨링의 힘을 활용하세요
컴퓨터 비전 프로젝트의 객체 라벨링 문제로 어려움을 겪고 계십니까?Sapien의 전문 데이터 레이블링 기술과 서비스는 병목 현상을 극복하고 고품질 결과를 달성하는 데 도움이 될 수 있습니다.숙련된 라벨러 팀이 시맨틱 분할, 인스턴스 세분화, 능동적 학습 기반 접근 방식을 비롯한 다양한 객체 라벨링 작업을 처리할 수 있습니다.Sapien을 사용하면 라벨링 리소스를 빠르고 효율적으로 확장하여 AI 모델에 정확하고 신뢰할 수 있는 객체 라벨링을 보장할 수 있습니다.
오늘 저희 팀에 연락하여 데모를 예약하고 자세히 알아보십시오.
자주 묻는 질문
객체 라벨링의 주요 과제는 무엇입니까?
몇 가지 일반적인 문제로는 대규모 데이터 세트의 필요성, 겹치는 오브젝트 및 오클루전 처리, 수동 주석의 시간이 많이 걸리는 특성 등이 있습니다.액티브 러닝과 같은 고급 기술은 이 과정을 간소화하는 데 도움이 됩니다.
객체 라벨링의 주요 과제는 무엇입니까?
몇 가지 일반적인 문제로는 대규모 데이터 세트의 필요성, 겹치는 오브젝트 및 오클루전 처리, 수동 주석의 시간이 많이 걸리는 특성 등이 있습니다.액티브 러닝과 같은 고급 기술은 이 과정을 간소화하는 데 도움이 됩니다.
사피엔은 객체 라벨링에 어떤 도움을 주나요?
Sapien은 시맨틱 세분화, 인스턴스 세분화 및 능동적 학습 기반 접근 방식을 위한 전문 데이터 라벨링 서비스를 제공하여 AI 모델에 대한 정확하고 확장 가능한 주석을 보장합니다.