인공지능(AI) 데이터 품질 표준안, 국내외 표준화 추진
페이지 정보
- 발행기관
- 과학기술정보통신부
- 저자
- 종류
- 정책
- 나노기술분류
- 발행일
- 2020-10-05
- 조회
- 1,900
본문
□ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고,
◦ 한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 10월 6일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식제안하였고, 관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에 최종 채택·확정될 것으로 전망됨.
◦ 또한, 앞으로 관련 내용을 국제표준화 성과로도 이어질 수 있도록 추진할 계획임.
□ 이번 표준안에서 인공지능 데이터의 품질을 “인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준”으로 정의하였고,
◦ 이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우되며 인공지능 기술과 서비스의 성능을 좌우하는 핵심요소임.
◦ 하지만, 아직 세계적으로 품질 수준이 높지 않은 상황이다. 예를 들어, 세계적 정보통신기술 기업들인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우에도 데이터 정확도가 43~83% 수준에 불과함.
* '14년 구축 시작된 MS COCO, '16년 구축 시작된 Google Open Images의 현재 라벨링 정확도(재현율-라벨링해야 하는 사물 중 라벨링된 비율)가 83%, 43%에 불과
◦ 이는 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 것이 중요한 원인으로 분석됨.
◦ 특히, 지난 4월 우리나라가 ‘인공지능 국제표준화회의(ISO/IEC JTC1/SC42)*’에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안하여 채택되는 등 이제 막 논의가 시작되는 초기단계임.
* 국제표준화기구(ISO)와 국제전기기술위원회(IEC)가 정보기술 분야 국제표준화를 위해 운영 중인 합동기술위원회(JTC 1)의 인공지능 분과위원회
- 이전글韓 메모리 또 한번 앞서간다... SK하이닉스, 세계 첫 DDR5 D램 출시 20.10.12
- 다음글사라질뻔한 32년 불소 연구...日 소부장 공세로 N랩 '날개' 달았다 20.09.28