한국지능정보사회진흥원(이하 NIA)은 과학기술정보통신부(이하 과기정통부) 와 함께 'AI 데이터 품질관리 가이드라인 v3.5'(이하 가이드라인)를 펴냈다고 26일 밝혔다.
가이드라인 v3.5는 2024년 '초거대AI 확산 생태계 조성사업'의 경험을 바탕으로 최신 인공지능 기술과 산업의 변화를 반영했다.
가이드라인은 총 3권으로 구성했다. 1권은 인공지능 데이터 품질관리 프레임워크, 2권은 데이터 구축 방법론 및 오류 대응 전략 실무사례, 3권은 생성형 인공지능 데이터에 특화된 품질관리 방법을 각각 제시하고 있다.
특히 이번 가이드라인은 언어모델(LLM) 뿐만 아니라 다중양식(멀티모달) 데이터, 합성데이터 등 생성형 인공지능을 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론을 별도 제시했다.
가이드라인은 AI허브 홈페이지나 NIA 누리집을 통해 누구나 내려받아 활용할 수 있다. 권별로도 별도 제공해 현장 실무자가 업무 및 관리 범위에 따라 편리하게 참조할 수 있도록 구성했다.
또 데이터 구성의 '잘된 사례 vs 부족한 사례' 비교 분석과 체크리스트 제공 등을 통해 현장 중심의 데이터 품질관리에 실질적인 도움을 줄 것으로 기대된다.
황종성 NIA 원장은 "인공지능 기술의 핵심은 데이터로 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다"며 "NIA는 빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다"고 밝혔다.
댓글 많은 뉴스
김여정 "리재명, 역사의 흐름 바꿀 위인 아냐" 발언에…대통령실 "진정성 왜곡 유감"
김건희 "내가 죽어야 남편 살길 열리지 않을까"
"사과한다고 2030 마음 열겠냐"는 조국에 "이래서 사면 안돼" 우재준 비판
조국 "내가 사과한다고 2030 마음 열겠나"…국힘 "그럼 은퇴해라"
"尹 구치소 CCTV 영상 보겠다"…민주당, '자료 제출' 요구하나