자료실
National Nanotechnology Policy Center

나노기술 및 정책 정보

과기정통부, 과학기술 기계학습 데이터 구축 신호탄

페이지 정보

발행기관
과학기술정보통신부
저자
 
종류
정책
나노기술분류
 
발행일
2020-07-24
조회
2,072

본문

과학기술정보통신부(장관 최기영, 이하 과기정통부‘)는 인공지능(AI) 기반의 디지털 뉴딜* 사업의 일환으로 한국과학기술정보연구원(KISTI)이 축적해 온 논문 등을 대상으로 대규모 과학기술 기계학습 데이터 구축사업을 시작함.

 

ㅇ이 사업은 재택근무를 통해 비대면으로 진행되며, 19세에서 34세 이하의 청년층을 대상으로 이달 25일부터 내달 10일까지 1차 모집하여 올해 12월까지 시행될 예정임.

* 디지털 뉴딜: 1930년대 대공황 직후 경제부흥을 위해 국가가 개입한 뉴딜 정책에 디지털을 결합한 개념으로, 첨단 ICT를 활용한 디지털 혁신, 이에 기반한 디지털 산업 육성을 통해 경제위기를 극복하고, 신성장 동력을 확보하자는 국가 주도형 발전 전략

 

과학기술 기계학습 데이터 구축 사업은 코로나 이후, 경제 상황에 대비한 대규모 공공기반 구축 사업으로, 2,000개의 비대면 일자리 창출을 목표로 함.

 

ㅇ 청년층 또는 취업취약계층을 우선적으로 선발하고, 직무교육을 통하여 인공지능(AI) 디지털 역량과 기계학습 데이터 구축 기술을 습득한 인력으로 육성하는 데 의의가 있음.

 

대규모 과학기술 공공데이터를구축하게 되면 한국과학기술정보연구원(KISTI)의 과학기술 지식인프라 연계 융합서비스(ScienceON)에서 인공지능(AI) 서비스운영을 통해 수요자에게 제공함.

 

ㅇ 국내논문과 국가 연구개발(R&D) 보고서 원문을 대상으로 과학기술분야 기계학습 데이터 5을 구축하며 최대 425만여 건의 과학기술 기계학습 데이터가 사업물량.

 

ㅇ 데이터 구축은 코로나19 상황이므로 온라인 시스템을 활용하여 비대면으로 진행하되, 데이터 품질 부실화를 방지하기 위하여 대중참여제작(크라우드소싱) 기반 검증 방식을 적용.

 

이번 사업을 통해 교육 받은 인력들은 앞으로도 과학기술분야 기계학습 데이터 레이블링 전문 인력으로 양성하여 지속적인 기계학습 데이터 구축 역량을 계발할 수 있도록 하여 데이터 산업 수요에 부응할 전망임.

 

ㅇ 텍스트, 영상, 음성 등 다양한 분야의 데이터 레이블러 수요 증가에 따라 데이터 수집·가공 관련 기업에서의 활발한 활용이 예상.

 

과학기술분야 기계학습 데이터가 구축·개방 되면, 과학기술분야 지식자원의 지능적 연계 및 융합연구 지원과 중소기업 기술혁신을 위한 의사결정 및 비즈니스 활용이 가능해질 것으로 예상됨.

 

ㅇ 본 사업을 통해 구축된 과학기술분야 기계학습 데이터는 과학기술분야 언어이해 모델개발에 활용될 예정이며, 과학기술분야 자연어 처리 문제 해결을 위한 초석으로 마련.

 

이와 관련하여, 과기정통부 권석민 과학기술일자리혁신관은 이번 기계학습을 위한 데이터 구축은 학술정보에 대한 접근성을 향상시켜 4차 산업혁명 시대의 근간인 DNA(데이터(Data)·네트워크(Network)·인공지능(AI))을 위한 데이터댐 건설에 주춧돌이 될 것이라고 밝힘.

 

이번 과학기술 기계학습 데이터 구축사업에 관한 자세한 내용은 KISTI 일자리혁신사업지원팀(042-869-1674) 또는이달 25일부터 KISTI 온라인 지원 누리집(https://kisti.recruiter.co.kr)를 통해 안내 받을 수 있음.