용어집

고맙습니다!제출이 접수되었습니다!
죄송합니다!양식을 제출하는 중에 문제가 발생했습니다.

D

D

데이터 거버넌스

데이터 거버넌스는 조직 내 데이터의 효과적인 관리, 품질, 보안 및 사용을 보장하는 정책, 프로세스, 표준 및 역할의 프레임워크입니다.여기에는 데이터 처리를 위한 지침 수립, 규정 준수 보장, 조직 전체의 데이터 관리에 대한 책임 정의가 포함됩니다.데이터 거버넌스의 의미는 조직이 데이터 정확성, 일관성 및 보안을 유지하는 동시에 효과적인 데이터 기반 의사 결정과 규정 준수를 가능하게 한다는 점에서 매우 중요합니다.

D

데이터 검증

데이터 검증은 데이터가 분석, 보고 또는 의사 결정에 사용되기 전에 데이터가 정확하고 완전하며 일관성이 있는지 확인하는 프로세스입니다.이 프로세스에는 사전 정의된 규칙이나 기준에 따라 데이터를 검사하여 오류, 불일치 또는 변칙을 식별하고 수정하는 작업이 포함됩니다.데이터 검증의 의미는 데이터 무결성을 유지하는 데 매우 중요합니다. 데이터 검증은 모든 애플리케이션 또는 분석에 사용되는 데이터의 품질과 신뢰성을 보장하여 결함이 있거나 잘못된 데이터를 기반으로 의사 결정을 내릴 위험을 줄여주므로 데이터 무결성을 유지하는 데 매우 중요합니다.

D

데이터 라벨링

데이터 레이블링은 이미지, 텍스트, 오디오 또는 비디오와 같은 데이터 요소에 의미 있는 레이블이나 태그를 할당하여 기계 학습 알고리즘에서 이해할 수 있도록 하는 프로세스입니다.이러한 레이블은 데이터를 범주화하거나 주석을 달기 때문에 기계 학습 모델이 데이터를 효과적으로 학습할 수 있습니다.데이터 레이블링은 지도 학습에서 필수적입니다. 지도학습에서는 레이블링된 데이터를 사용하여 예측, 데이터 분류 또는 패턴 인식을 위한 모델을 학습시킵니다.데이터 레이블링의 의미는 AI 모델이 의도한 작업을 수행하는 데 정확하고 신뢰할 수 있도록 하는 데 매우 중요합니다.

D

데이터 레이크

데이터 레이크는 기업이 규모에 관계없이 대량의 정형, 반정형 및 비정형 데이터를 저장할 수 있는 중앙 집중식 저장소입니다.기존 데이터베이스 또는 데이터 웨어하우스와 달리 데이터 레이크는 처리, 분석 또는 쿼리에 필요할 때까지 원시 데이터를 원래 형식으로 저장할 수 있습니다.데이터 레이크는 조직이 다양한 소스의 다양한 데이터 유형을 처리하고 고급 분석, 기계 학습 및 빅 데이터 애플리케이션을 지원할 수 있게 해주기 때문에 현대 데이터 관리에서 매우 중요합니다.

D

데이터 리니지

데이터 계보는 데이터의 출처부터 다양한 처리 및 변환 단계를 거쳐 최종 목적지에 도달할 때까지 데이터 흐름을 추적하고 문서화하는 것을 말합니다.다양한 시스템, 데이터베이스 및 애플리케이션에서 데이터가 어떻게 이동, 변경 및 상호 작용하는지에 대한 상세한 맵을 제공합니다.데이터 계보의 의미는 조직 내 데이터의 이력, 사용 및 변화를 이해하여 데이터 정확성, 규정 준수 및 투명성을 보장하는 데 매우 중요합니다.

D

데이터 마이닝

데이터 마이닝은 고급 기술과 알고리즘을 사용하여 대규모 데이터 세트에서 의미 있는 패턴, 상관 관계 및 통찰력을 추출하는 프로세스입니다.여기에는 광범위한 데이터를 분석하여 정보에 입각한 의사 결정과 예측을 이끌어낼 수 있는 숨겨진 추세와 정보를 찾아내는 것이 포함됩니다.데이터 마이닝의 의미는 복잡한 데이터를 이해하면 전략적 이점을 얻고 결과를 개선할 수 있는 비즈니스 인텔리전스, 마케팅, 재무 및 의료와 같은 분야에서 특히 중요합니다.

D

데이터 마트

데이터 마트는 조직 내 특정 비즈니스 영역, 부서 또는 주제에 초점을 맞춘 데이터 웨어하우스의 하위 집합입니다.마케팅, 영업 또는 재무팀과 같은 특정 사용자 그룹이 관련 데이터를 보다 쉽게 액세스하고 효율적으로 볼 수 있도록 설계되었습니다.데이터 마트의 의미는 이러한 그룹이 일반적으로 전체 데이터 웨어하우스에 저장되는 방대한 양의 데이터를 샅샅이 뒤질 필요 없이 자신의 요구에 가장 적합한 데이터에 빠르게 액세스하고 분석할 수 있도록 한다는 점에서 의미가 있습니다.

D

데이터 매핑

데이터 매핑은 서로 다른 소스의 데이터 요소 간에 연결을 생성하여 통합 뷰에 연결 및 통합할 수 있도록 하는 프로세스입니다.이 프로세스에는 한 시스템, 데이터베이스 또는 형식의 데이터가 다른 시스템, 데이터베이스 또는 형식의 데이터와 어떻게 대응하는지 정의하여 정보가 다양한 플랫폼에서 정확하게 전송, 변환 및 사용되도록 하는 작업이 포함됩니다.데이터 매핑은 시스템 간에 이동할 때 데이터가 일관되고 정확하며 의미 있게 유지되도록 보장하므로 데이터 통합, 마이그레이션 및 변환 프로세스에서 매우 중요합니다.

D

데이터 복제

데이터 복제는 조직 전체에서 가용성, 안정성 및 일관성을 보장하기 위해 여러 위치 또는 시스템에서 데이터를 복제하고 유지 관리하는 프로세스입니다.이 프로세스에는 업데이트가 발생하더라도 동일하거나 거의 동일하게 유지되도록 데이터 사본을 만들고 동기화하는 작업이 포함됩니다.데이터 복제의 의미는 특히 데이터를 여러 위치에서 사용할 수 있어야 하는 분산 컴퓨팅 환경에서 비즈니스 연속성, 재해 복구 및 효율적인 데이터 액세스를 보장하는 데 매우 중요합니다.

D

데이터 수집

데이터 수집은 다양한 소스에서 정보를 수집 및 측정하여 분석, 의사 결정 또는 기계 학습 모델 교육에 사용할 수 있는 데이터 세트를 만드는 프로세스입니다.이 프로세스에는 설문조사, 센서, 온라인 추적, 실험, 데이터베이스 추출 등 다양한 방법을 통해 체계적으로 데이터를 수집하는 과정이 포함됩니다.수집된 데이터의 품질, 정확성 및 관련성이 후속 분석 또는 모델링 작업의 효율성에 직접적인 영향을 미치기 때문에 데이터 수집의 의미가 매우 중요합니다.

D

데이터 암호화

데이터 암호화는 읽을 수 있는 일반 데이터를 암호문이라고 하는 인코딩된 형식으로 변환하는 프로세스입니다. 암호문은 올바른 암호 해독 키를 사용하여 권한 있는 당사자만 해독하고 읽을 수 있습니다.이 프로세스를 통해 개인 데이터, 재무 기록 또는 기밀 통신과 같은 민감한 정보를 무단 액세스나 도난으로부터 보호할 수 있습니다.데이터 암호화는 저장 및 전송 중에 데이터 프라이버시와 무결성을 보호하기 때문에 사이버 보안에서 매우 중요합니다.

D

데이터 전처리

데이터 전처리는 원시 데이터를 깔끔하고 체계적이며 사용 가능한 형식으로 변환하는 것을 포함하는 데이터 분석 및 기계 학습 파이프라인의 중요한 단계입니다.이 프로세스에는 데이터 정리, 정규화, 변환 및 특징 추출과 같은 다양한 작업이 포함되며, 이 모든 작업은 데이터 품질을 개선하고 분석 또는 모델 학습에 적합하도록 만드는 것을 목표로 합니다.데이터 전처리는 머신 러닝 모델의 정확성과 성능에 직접적인 영향을 미치기 때문에 필수적입니다. 따라서 이러한 모델에 입력되는 데이터가 일관되고 완전하며 오류나 편향이 없어야 하기 때문입니다.

D

데이터 정규화

데이터 정규화는 데이터 분석 및 머신러닝에서 사용되는 전처리 기법으로, 데이터셋의 특징이 공통 척도 (주로 0~1 또는 -1과 1 사이) 가 되도록 데이터 집합의 특성 척도를 조정합니다.이 프로세스를 통해 규모 때문에 모델을 지배하는 특징이 하나도 없기 때문에 모델이 데이터에서 더 효과적으로 학습할 수 있습니다.데이터 정규화는 특징의 단위나 척도가 서로 다른 시나리오에서 매우 중요한데, 이는 머신러닝 알고리즘의 성능과 안정성을 개선하는 데 도움이 되기 때문입니다.

D

데이터 주석

데이터 주석은 컨텍스트와 의미를 제공하기 위해 데이터에 레이블을 지정하거나 태그를 지정하여 기계 학습 모델을 학습하는 데 사용할 수 있도록 하는 프로세스입니다.이 프로세스에는 AI 시스템이 패턴을 인식하고 의사 결정을 내리고 데이터로부터 학습할 수 있도록 텍스트, 이미지, 오디오 또는 비디오와 같은 다양한 유형의 데이터에 메타데이터를 추가하는 작업이 포함됩니다.주석의 품질과 정확성이 작업을 효과적으로 수행하는 모델의 능력에 직접적인 영향을 미치기 때문에 데이터 주석의 의미는 AI 및 기계 학습 모델 개발에 매우 중요합니다.

D

데이터 주석 도구

데이터 주석 도구는 기계 학습 모델에서 사용하기 위해 이미지, 텍스트, 오디오 또는 비디오와 같은 데이터에 레이블을 지정하거나 태그를 지정하는 프로세스를 용이하게 하기 위해 설계된 소프트웨어 애플리케이션 또는 플랫폼입니다.이러한 도구는 원시 데이터에 메타데이터를 추가하는 프로세스를 자동화하고 간소화하여 데이터를 이해하고 학습 알고리즘에 사용할 수 있도록 합니다.주석의 품질이 모델의 정확성과 성능에 직접적인 영향을 미치기 때문에 데이터 주석 도구의 의미는 AI 및 기계 학습 모델 개발에 매우 중요합니다.

D

데이터 증강

데이터 증강은 학습 데이터의 다양성과 양을 인위적으로 늘리는 데 사용되는 기계 학습 및 인공 지능 (AI) 기법입니다.이는 기존 데이터에 이미지를 변경하거나 텍스트에 노이즈를 추가하는 등 다양한 수정 또는 변형을 적용하여 이루어집니다.주요 목표는 학습 데이터를 일반화하는 모델의 기능을 향상시켜 실제 응용 프로그램에서 발생하는 변화에 더 견고하게 만드는 것입니다.데이터 증대는 대량의 레이블이 지정된 데이터를 수집하는 것이 어렵거나 비용이 많이 드는 컴퓨터 비전 및 자연어 처리 (NLP) 와 같은 분야에서 특히 중요합니다.

D

데이터 큐레이션

데이터 큐레이션은 사용자가 액세스할 수 있고 안정적이며 가치가 있도록 데이터를 구성, 관리 및 유지 관리하는 프로세스입니다.이 프로세스에는 데이터를 선택, 주석 달기, 정리 및 보존하는 작업이 포함되므로 더 쉽게 찾고 이해하고 사용할 수 있습니다.데이터 큐레이션은 시간이 지나도 데이터가 정확하고 관련성이 높으며 유용하게 유지되도록 하여 더 나은 의사 결정과 분석을 지원하는 데 도움이 되기 때문에 연구, 비즈니스 및 데이터 과학에서 매우 중요합니다.

D

데이터 클리닝

데이터 정리 또는 데이터 스크러빙이라고도 하는 데이터 정리는 데이터 집합의 오류, 불일치 및 부정확성을 식별하고 수정하는 프로세스입니다.이 프로세스에는 손상된 데이터 제거 또는 수정, 누락된 값 처리, 중복 문제 해결, 데이터의 일관성 및 분석 준비가 완료되었는지 확인하는 작업이 포함됩니다.깨끗하고 정확한 데이터는 신뢰할 수 있고 유효한 결과를 생성하는 데 필수적이므로 데이터 정리의 의미는 데이터 분석 및 머신 러닝에서 매우 중요합니다.

D

데이터 통합

데이터 통합은 다양한 소스의 데이터를 통합되고 일관되며 일관된 뷰로 결합하는 프로세스입니다.이 프로세스에는 다양한 시스템에서 데이터를 추출하고 호환성을 보장하도록 변환한 다음 단일 데이터 세트로 액세스하고 분석할 수 있는 데이터 웨어하우스와 같은 중앙 리포지토리에 로드하는 작업이 포함됩니다.데이터가 여러 플랫폼 또는 시스템에 흩어져 있는 환경에서는 데이터 통합의 의미가 매우 중요합니다. 이를 통해 조직은 모든 관련 데이터를 한 곳에 모아 운영, 고객 및 시장을 포괄적으로 이해할 수 있기 때문입니다.

D

데이터 파이프라인

데이터 파이프라인은 소스에서 최종 대상 (일반적으로 데이터 웨어하우스, 데이터 레이크 또는 분석 시스템) 으로 데이터의 이동, 변환 및 처리를 자동화하는 일련의 프로세스 및 도구입니다.이 프로세스에는 다양한 소스에서 데이터를 추출하여 사용 가능한 형식으로 변환하고 분석 및 의사 결정을 위해 액세스할 수 있는 스토리지 또는 분석 플랫폼으로 로드하는 작업이 포함됩니다.데이터 파이프라인의 의미는 현대 데이터 엔지니어링에서 매우 중요합니다. 데이터 파이프라인은 시스템 전반에서 원활한 데이터 흐름을 가능하게 하여 조직이 운영 및 분석을 위해 시기적절하고 정확하며 일관된 데이터를 확보할 수 있도록 하기 때문입니다.

D

데이터세트

데이터셋은 구조화된 데이터 모음으로, 대개 표 형식으로 구성됩니다. 여기서 각 행은 데이터 요소 또는 관측값을 나타내고 각 열은 해당 데이터 요소와 관련된 변수 또는 특징을 나타냅니다.데이터셋은 통계, 머신러닝, 데이터 분석을 비롯한 다양한 분야에서 모델을 학습시키고, 가설을 테스트하거나, 데이터에서 통찰력을 도출하는 데 사용됩니다.데이터셋은 모든 분석 또는 머신러닝 프로젝트의 기본 구성 요소 역할을 하므로 데이터 과학에서는 데이터셋의 의미가 매우 중요합니다.

D

도메인 일반화

도메인 일반화는 특정 영역에만 국한되지 않고 일반화할 수 있는 특징과 패턴을 학습하여 보이지 않는 여러 영역에서 잘 수행되도록 모델을 학습하는 것을 포함하는 기계 학습 개념입니다.학습 영역에 지나치게 적합할 수 있는 기존 모델과 달리, 영역 일반화는 학습 중에 접하지 못했던 새로운 환경이나 데이터 세트에 적응하고 일반화할 수 있는 모델을 만드는 것을 목표로 합니다.도메인 일반화의 의미는 모델이 다양하고 예측할 수 없는 조건에서 강력하고 효과적이어야 하는 시나리오에서 특히 중요합니다.

D

도메인 적응

도메인 적응은 한 도메인 (소스 도메인) 에서 학습된 모델을 다른 관련 도메인 (대상 도메인) 에서 잘 수행하도록 조정하는 데 초점을 맞춘 기계 학습 기법입니다.이는 대상 도메인에는 레이블이 지정된 데이터가 부족하지만 원본 도메인에는 레이블이 지정된 데이터가 충분한 경우에 특히 유용합니다.도메인 적응은 소스에서 대상 도메인으로 지식을 전달하는 데 도움이 되므로 모델을 다양한 환경 또는 데이터 세트에서 더 잘 일반화할 수 있습니다.도메인 적응의 의미는 언어 간 텍스트 처리, 다양한 조명 조건에서의 이미지 인식, 시뮬레이션된 데이터로 학습한 모델을 실제 환경에 맞게 적용하는 등 교육 시나리오와 배포 시나리오 간에 데이터 분포가 다른 응용 분야에서 매우 중요합니다.

D

드라이브 바이 와이어

Drive-by-Wire (dBW) 는 기존의 기계식 및 유압식 차량 제어 시스템을 전자 제어로 대체하는 자동차 기술입니다.센서, 액추에이터 및 전자 제어 장치 (ECU) 를 사용하여 조향, 제동 및 스로틀 제어와 같은 중요한 기능을 관리합니다.Drive-by-Wire 시스템은 물리적 연결이 아닌 전자적으로 명령을 전송함으로써 차량 효율성을 높이고 무게를 줄이며 자율 주행 및 V2X (Vehicle-to-Everything) 통신과 같은 고급 기능을 위한 기반을 마련합니다.

D

디멘셔널리티 감소

차원 축소는 데이터 처리 및 머신 러닝에서 관련 정보를 최대한 많이 보존하면서 데이터셋의 입력 변수 또는 특징 수를 줄이는 데 사용되는 기법입니다.차원 축소는 데이터를 단순화함으로써 기계 학습 모델을 더 효율적이고 빠르며 해석하기 쉽게 만드는 동시에 과적합 위험을 최소화하는 데 도움이 됩니다.차원 축소의 의미는 데이터셋에 많은 특징이 포함되어 있어 모델이 복잡해지고 학습하는 데 계산 비용이 많이 들 수 있는 시나리오에서 매우 중요합니다.

D

디지털 트윈

디지털 트윈은 실시간 데이터를 사용하여 물리적 객체의 동작과 성능을 시뮬레이션하고 미러링하여 만든 물리적 객체, 시스템 또는 프로세스를 가상으로 표현한 것입니다.이 개념은 센서, 사물 인터넷 (IoT), 인공 지능 (AI), 데이터 분석을 비롯한 다양한 기술을 통합하여 물리적 시스템의 모니터링, 분석 및 최적화를 가능하게 하는 정확한 실시간 시뮬레이션을 제공합니다.디지털 트윈은 제조, 의료, 도시 계획, 자율주행차와 같은 산업 전반에서 효율성을 개선하고 결과를 예측하며 의사 결정을 강화하는 데 사용됩니다.

D

딥 블루

딥 블루는 IBM에서 개발한 체스 게임으로, 표준 시간 제어 하에 경기에서 현 세계 체스 챔피언을 물리친 최초의 머신으로 유명합니다.이 역사적인 사건은 1997년 딥 블루가 게리 카스파로프를 제치고 인공 지능 (AI) 개발에 중요한 획을 그으면서 일어났습니다.딥 블루는 체스 실력뿐 아니라 AI 분야의 선구적인 업적으로도 그 의미가 있습니다. 이는 이전에 인간 지능의 전유물이라고 여겨졌던 복잡하고 전략적인 작업을 컴퓨터가 수행할 수 있는 잠재력을 보여줍니다.

D

심층 학습 (심층 강화 학습)

심층 강화 학습 (DRL) 은 강화 학습 원리를 심층 신경망과 결합한 딥 러닝의 전문 영역입니다.강화 학습에서 에이전트는 누적 보상을 극대화하기 위한 환경에서 행동을 취함으로써 의사 결정을 내리는 방법을 학습합니다.심층 강화 학습은 심층 신경망을 사용하여 복잡한 함수와 값 추정치의 근사치를 구함으로써 이를 확장합니다. 이를 통해 에이전트는 원시 이미지 또는 복잡한 게임 상태와 같은 고차원 입력 공간을 처리할 수 있습니다.심층 강화 학습은 명시적 프로그래밍 없이 복잡하고 동적인 환경을 학습하고 이에 적응할 수 있는 지능형 시스템의 개발에 큰 의미가 있습니다.

D

의사 결정 경계

결정 경계는 분류 문제에서 여러 클래스를 구분하는 특징 공간의 표면 또는 선입니다.이는 모델이 데이터 포인트의 분류를 결정하는 시점을 나타냅니다.데이터 포인트가 결정 경계의 한 쪽에 속하면 한 클래스로 분류되고, 다른 쪽에 속하면 다른 클래스로 분류됩니다.의사 결정 경계의 의미는 머신러닝 모델이 제공된 특징을 기반으로 여러 범주를 어떻게 구분하는지 이해하는 데 매우 중요합니다.

D

의사 결정 트리

의사 결정 트리는 분류 및 회귀 작업에 사용되는 일종의 감독된 기계 학습 알고리즘입니다.이는 우연한 사건 결과, 리소스 비용, 효용을 포함하여 의사 결정과 그에 따른 가능한 결과를 모델링합니다.트리 구조는 데이터의 특징 또는 속성을 나타내는 노드, 의사 결정 규칙을 나타내는 분기, 결과 또는 클래스를 나타내는 잎으로 구성됩니다.의사 결정 트리는 기업과 연구자가 데이터를 기반으로 정보에 입각한 의사 결정을 내리는 데 도움이 되는 시각적이고 해석 가능한 모델을 제공하기 때문에 데이터 분석 및 기계 학습에서 매우 중요한 의미를 갖습니다.

D

의사결정 알고리즘

의사 결정 알고리즘은 사전 정의된 목표 또는 기준에 따라 데이터를 분석하고, 옵션을 평가하고, 최선의 조치를 선택하도록 설계된 계산 프로세스입니다.이러한 알고리즘은 현대 기술의 핵심으로, 인공 지능, 로봇 공학, 의료, 금융 및 자율 주행 자동차와 같은 분야에서 시스템이 정보에 입각하고 자율적인 결정을 내릴 수 있도록 합니다.의사 결정 알고리즘은 데이터 기반 통찰력을 활용하여 다양한 애플리케이션에서 효율성, 정확성 및 적응성을 향상시킵니다.

See How our Data Labeling Works

Schedule a consult with our team to learn how Sapien’s data labeling and data collection services can advance your speech-to-text AI models