[AI 이끄는 인재들] 마인즈랩 "음성인식 기술, 세계를 선도하다"

2020-10-14 17:52:03

- 훈풍부는 인공지능 업계, 핵심은 'AI 기술 고도화'

[프라임경제] "AI 알고리즘을 몰라도 누구나 쉽게 AI 서비스를 만들도록"

'AI 기술 혁신'을 전면에 내세운 마인즈랩은 국내뿐 아니라 해외사업까지 인공지능 활용분야를 다각화하고 있다.

클라우드 기반의 AI서비스로 누구나 쉽게 만들수 있는 이유로 원하는대로 AI기술을 조합해 사용할 수 있는 '마음AI'를 선보인 것.

이 서비스의 핵심은 마인즈랩 브래인팀이다. 이팀은 마음AI 유저들이 사용할 AI엔진을 만들고, 개선하기 위한 최신 AI기술을 연구하고 개발하는 팀이다. 

▲박승원 연구원과(좌측) 이준혁 연구원은 인공지능관련된 논물을 토론하고 있다. ⓒ 마인즈랩

이 팀이 있기 전에도 AI 알고리즘에 기반한 제품을 판매했지만 AI제품의 사용성을 높이는 한계가 있었지만, 브레인팀이 생겨난 이후 뛰어난 역량을 지는 연구원들이 직접 엔진을 개발해 사용성 높고 커스터마이징도 가능한 AI기술을 선보이고 있다. 

현재 브레인팀에서 개발 중인 △문장교정 △음성향상 △해상도증강 △치아교정 △얼굴교체 △음성변환 기술 등은 'AI 기술 도고화'를 통해 기존 인공지능 기술 수준을 한층 끌어올렸다는 평가를 받고 있다.

이에 상장을 앞둔 마인즈랩의 브레인팀 연구원을 만나 AI기술의 핵심에 대해 이야기를 나눠봤다.

[인터뷰①] 박승원 브레인팀 연구원 "인공지능은 재밌는 놀이터"

▲박승원 마인즈랩 브레인팀 연구원. ⓒ 마인즈랩

"인공지능은 재밌는 놀이터 같아요. 데이터가 많고 고품질일수록 인공지능을 통해 의미있는 값을 도출하죠"

박승원 연구원은 인공지능에 대해 이같이 설명했다.

특히 '코타트론(Cotatron)' 연구 논문의 저자인 박 연구원은 코타트론으로 AI 세계 톱 학회인 인터스피치(Interspeech)에 게재 승인되면서 마인즈랩의 음성 AI 기술력을 세계에 입증했다.

코타트론 기술은 딥러닝 기반의 음성 변환(Voice Conversion) 기술인 '코타트론'로 입력 음성이 주어지면 마치 다른 사람이 그 음성을 똑같은 어조로 읽은 듯한 음성을 합성해내는 AI 기술이다.

박 연구원은 "코타르론 기술을 활용해 음성을 다른 화자의 음성으로 변환해 음성변환 활용가능한 분야를 확장했다"고 설명했다.

이어 "이 기술은 세계적으로 음성합성 관련 수요가 많은 엔터테인먼트, 콜센터 등의 분야에서 큰 경제적 가치를 창출해 낼 것"라고 내다봤다.

주로 음성합성기술은 한국어와 영어를 기본으로 하고 있지만 최근 연구를 통해 일본어와 아랍어 등 전 세계적으로 시장이 확대될 전망이다.

예를 들어 화자의 음성데이터를 20분 동안 인공지능이 학습해 자연스러운 AI목소리를 만들어 내는 것. 그동안 한국어로 학습할 경우 AI목소리는 한국어로만 가능했다면, 이제 영어 일본어 등이 가능해질 것으로 보인다.

브레인팀의 핵심맴버인 박 연구원은 팀원들과 인공지능 중에서도 음성, 오디오 관련된 논물을 찾고 읽어보며 음성합성·음성인식 연구개발에 매진하는 이유다.

그 결과 작년 상반기에는 음성분리(VoiceFilter), 음성정제, 화자인증, 화자분리 기술을 개발, 이어 음성합성과 음성변환 기술 개발을 이어가고 있다.

그는 "마음AI에 있는 음성 관련 엔진의 종류가 크게 늘었고, 기존에 있었던 음성합성 엔진의 안정성이 개선됐다"고 설명하면서 "전 세계적으로 음성합성 관련 수요가 많은 엔터테인먼트, 콜센터 등의 분야에서 큰 경제적 가치를 창출해낼 것"이라고 말했다.

마지막으로 인공지능을 준비하는 후배들에게 "인공지능 시장의 가치를 인식한 탓인지 전공을 선택하는 과정에서 컴퓨터공학·전기공학 계열이 엄청난 인기를 끌고 있다"고 밝혔다.

그러면서 그는 "인공지능의 경우 컴퓨터공학으로 분류되기도 하지만 그 이론은 수학과 물리학을 기반으로 하는 경우가 많아서 인공지능 계열의 진로를 원한다면 프로그래밍 연습과 함께 수학과, 물리학과 과목을 챙겨 듣는 것이 도움이 될 것"이라고 조언했다.

[인터뷰②] 이준혁 브레인팀 연구원 "인공지능은 마법이 아냐"

▲이준혁 브레인팀 연구원. ⓒ 마인즈랩

인공지능을 활용한 기술이 다양한 분야로 확대되면서 그야말로 '인공지능 열풍'이 불고 있다.

인공지능을 적용한 스피커부터 상담을 안내하는 자동화된 챗봇 상담과 회의록까지 알아서 척척 정리를 도와주는 기능이 대표적인 사례다.

이에 대해 이준혁 연구원은 "대부분 사람들이 인공지능을 마법처럼 여기지만 모든 인공지능이 '대박'나는 것은 아니라고 생각한다"고 운을 띄었다.

AI를 통해 만족할만한 결과값을 도출하기 위해서는 많은 양의 데이터와 오랜 시간 학습이 필요하기 때문이다.

급격히 성장한 인공지능에 발맞춰 마인즈랩 브레인팀은 NLP(자연어처리)를 비롯해 Vision(비전), 오디오와 같은 여러 일을 진행하는 연구원들이 함께 일하고 있다.

이 연구원은 "요즘 유행하는 방법론들은 분야를 막론하고 사용되기 때문에 나보다 먼저 그 방법론을 경험한 사람이 있으면 개발하다 막혔을 때 큰 도움이 된다"고 말했다.

분야는 제각각이지만 브레인팀 연구원들은 서로 막히는 부분이 있으면 오피스 가운데 모여 열띤 토론 끝에 해결점을 찾아내기도 한다.

주로 매주 읽은 논문과 연구 과정을 공유하는 세미나를 진행해 다양한 분야의 아이디어를 리뷰하는 시간이 중요하기 때문.

이 연구원은 "앞으로 인공지능은 점차 확대될 것으로 보인다. 코로나19 여파로 국내와 해외기업에서 연구개발 인원을 줄인다는 말도 있지만, 오히려 비대면 서비스 열풍으로 인공지능의 성장 폭이 커질것으로 보인다"고 전망했다.

끝으로 그는 "인공지능과 딥러닝은 다양한 분야의 지식이 사용되므로 수학과 컴퓨터 이론은 물론 엔트로피 같은 물리학에 뿌리를 두고 있는 것도 많다"면서 "작곡을 했던 경험을 바탕으로 오디오 분야의 신호처리에 딥러닝 적용한 사례가 있다. 사전지식을 쌓기 위해 딥러닝 뿐 아니라 다양한 분야의 경험도 도움이 된다"고 밝혔다.



카카오 페이스북 카카오스토리 트위터


Copyright 프라임경제 ⓒ 무단전재 및 재배포금지
이전 1 / 0 다음
Copyright ⓒ 프라임경제 all rights reserved.