한국지능정보사회진흥원, AI 데이터 품질관리 가이드라인 v3.5 발간

입력 2025-05-26 13:14:12

한국지능정보사회진흥원의 AI 데이터 품질관리 가이드라인 v3.5. 한국지능정보사회진흥원 제공
한국지능정보사회진흥원의 AI 데이터 품질관리 가이드라인 v3.5. 한국지능정보사회진흥원 제공

한국지능정보사회진흥원(이하 NIA)은 과학기술정보통신부(이하 과기정통부) 와 함께 'AI 데이터 품질관리 가이드라인 v3.5'(이하 가이드라인)를 펴냈다고 26일 밝혔다.

가이드라인 v3.5는 2024년 '초거대AI 확산 생태계 조성사업'의 경험을 바탕으로 최신 인공지능 기술과 산업의 변화를 반영했다.

가이드라인은 총 3권으로 구성했다. 1권은 인공지능 데이터 품질관리 프레임워크, 2권은 데이터 구축 방법론 및 오류 대응 전략 실무사례, 3권은 생성형 인공지능 데이터에 특화된 품질관리 방법을 각각 제시하고 있다.

특히 이번 가이드라인은 언어모델(LLM) 뿐만 아니라 다중양식(멀티모달) 데이터, 합성데이터 등 생성형 인공지능을 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론을 별도 제시했다.

가이드라인은 AI허브 홈페이지나 NIA 누리집을 통해 누구나 내려받아 활용할 수 있다. 권별로도 별도 제공해 현장 실무자가 업무 및 관리 범위에 따라 편리하게 참조할 수 있도록 구성했다.

또 데이터 구성의 '잘된 사례 vs 부족한 사례' 비교 분석과 체크리스트 제공 등을 통해 현장 중심의 데이터 품질관리에 실질적인 도움을 줄 것으로 기대된다.

황종성 NIA 원장은 "인공지능 기술의 핵심은 데이터로 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다"며 "NIA는 빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다"고 밝혔다.