• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

"머라카노, 사투리를 산다꼬?" 솔트룩스, 한국어 방언 AI 데이터 구축

10년 이상 지역 거주한 사투리 사용자 모집…"당신의 사투리를 들려주세요"

김이래 기자 | kir2@newsprime.co.kr | 2020.11.04 10:13:12

[프라임경제] 솔트룩스는 정부의 디지털뉴딜 사업의 하나로 '한국어 방언 AI데이터'구축 사업을 주관하면서 강원도를 비롯해 경상도, 전라도, 제주도, 충청도 사투리 사용자를 모집한다고 4일 밝혔다.

'한국어 방언 AI 데이터 구축 사업' 크라우드워커 모집 홍보 포스터. ⓒ 솔트룩스

이 사업은 인공지능이 각 지역별 사투리도 잘 알아들을 수 있도록 인공지능 학습용 방언 데이터를 대규모로 수집하고 가공하는 프로젝트로 과학기술정보통신부와 한국정보화진흥원에서 주최·주관하는 사업이다.

솔트룩스는 대규모 학습용 데이터 구축 전문성을 바탕으로 주관사를 맡고, 지역언어와 데이터 구축, 품질 검수 등 부문별 전문성을 보유한 15개 기관이 함께 참여하는 컨소시엄으로 사업을 진행한다.

각 지역별 수행기관은 △(강원도)인피닉, 디큐, 타임소프트 △(경상도)소리자바, 코아 인포메이션 △(전라도)솔트룩스 광주인공지능센터, 디그랩, 도담에스엘 △(제주도)이스트소프트, 사람과 숲, 제주국제자유도시개발센터, 데이터메이커 △(충청도)디그랩, 나라지식정보, 엑소텍이 맡았다.

이번에 모집 분야는 특정 주제에 대해 사투리로 이야기를 녹음하는 '화자'와 녹음된 사투리를 타이핑하는 '전사', 녹음 및 전사된 파일의 품질을 검수하는 '검수', 총 3가지로 구분된다.

화자와 전사의 경우 각 지역에서 10년 이상 거주한 사투리 사용자라면 누구나 참여 가능해 취업준비생, 경력단절여성, 60~70대 노령층 등 경제활동에 어려움을 겪고 있는 이들에게 많은 관심을 받고 있다.

특히 본 사업은 기업 활동에 일반 대중이 참여하는 크라우드소싱(crowdsourcing) 방식을 통해 데이터 수집 인력을 대면·비대면으로 모집해 진행하는 것이 특징이다.

크라우드소싱은 대중(crowd)과 아웃소싱(outsourcing)의 합성어로, 기업의 생산과 서비스 과정에 소비자나 일반 대중을 참여해 아이디어를 얻고 이를 기업 활동에 활용하는 방식이다.

현재 크라우드소싱에 참여할 크라우드워커 모집이 계속해서 진행 중이며 이번 사업은 12월 말까지 데이터 구축을 완료할 예정이다. 


  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지