자료실
National Nanotechnology Policy Center

나노기술 및 정책 정보

인공지능(AI) 데이터 품질 표준안, 국내외 표준화 추진

페이지 정보

발행기관
과학기술정보통신부
저자
 
종류
정책
나노기술분류
 
발행일
2020-10-05
조회
1,897

본문

과학기술정보통신부(장관 최기영, 이하 과기정통부’)는 디지털 뉴딜 데이터 댐의 핵심자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고,

 

한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 106일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식제안하였고, 관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에 최종 채택·확정될 것으로 전망됨.

 

또한, 앞으로 관련 내용을 국제표준화 성과로도 이어질 수 있도록 추진할 계획임.

 

이번 표준안에서 인공지능 데이터의 품질을 인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준으로 정의하였고,

 

이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우되며 인공지능 기술과 서비스의 성능을 좌우하는 핵심요소임.

 

하지만, 아직 세계적으로 품질 수준이 높지 않은 상황이다. 예를 들어, 세계적 정보통신기술 기업들인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우에도 데이터 정확도가 43~83% 수준에 불과함.

* '14년 구축 시작된 MS COCO, '16년 구축 시작된 Google Open Images의 현재 라벨링 정확도(재현율-라벨링해야 하는 사물 중 라벨링된 비율)83%, 43%에 불과

 

이는 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 것이 중요한 원인으로 분석됨.

 

특히, 지난 4월 우리나라가 인공지능 국제표준화회의(ISO/IEC JTC1/SC42)*’에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안하여 채택되는 등 이제 막 논의가 시작되는 초기단계임.

* 국제표준화기구(ISO)와 국제전기기술위원회(IEC)가 정보기술 분야 국제표준화를 위해 운영 중인 합동기술위원회(JTC 1)의 인공지능 분과위원회