• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

[기획특집-①] 'AI뉴스룸' 제작현장을 가다

"미디어 생태계, 변화의 기록 또는 생존의 기억"

강경식 기자 | kks@newsprime.co.kr | 2023.10.30 21:43:13
[프라임경제] 인공지능의 도입은 산업분야를 막론하고 피할 수 없는 선택이 됐다. 미디어산업도 다를 것 없다. 정보전달의 핵심인 '기술(記述)의 기술(奇術)'은 생성형 인공지능의 등장으로 더 이상 자랑거리가 되지 못한다. 과연, 공상과학 소설의 예측대로 AI의 발달에 '기록하는 사람'들은 멸종하게 될 것인가?

미디어시장의 한 축이자 '뉴미디어'의 상징과도 같은 인터넷신문은 지난 20년간 눈부신 성장과 발전을 거듭했다. 하지만 조금만 들여다 보아도 대부분 회사가 내부 IT개발 인력을 운영하지 않고 있음을 알 수 있다. 

기업이 생산한 제품을 홍보하고 판매하는 기술적 연구에 관심조차 기울이지 않는다는 사실은 미디어 업계 전반의 미래를 어둡게 만든다. 

모두가 '어쩔 수 없다'고 할 때 '프라임경제'는 '아니'라고 답한다. 수년 전부터 기자 고유의 기능과 인공지능이 상생할 수 있는 방법을 연구하고 실현해 왔기 때문이다. 

과거 종이신문이 독자를 만나기 위해 조판과 윤전이 필요했다면, 인터넷신문은 변화하는 생태계와 시시각각 달라지는 플랫폼 환경을 능동적으로 대응할 수 있는 R&D조직이 필요하다. 프라임경제는 다가올 변화의 시대에 전사적인 투자와 R&D만이 '살 길'이라고 결정했다.

언론진흥재단의 지원을 받아 프라임경제가 선택한 '생로(生路), 인공지능 플랫폼 도입 과정의 비밀을 공개한다. 

OpenAI의 Chat-GPT는 등장 이후 기자들의 일자리를 가장 먼저 빼앗을 것으로 예측된 바 있다. ⓒ 프라임경제


현재 프라임경제가 도입한 AI뉴스룸은 립페이크(LipFake)와 TTS(Text-To-Speech)가 결합된 동영상 콘텐츠다. 양질의 AI뉴스룸 콘텐츠를 생산하기 위해 신문사가 아닌 미디어테크 기업으로 프라임경제가 주력하는 부분은 크게 세 가지로 구분된다. 

첫째, 현직 기자의 고품질 데이터를 생성하고 가공한다. 

프라임경제는 AI캐스터 정체성을 현직 기자의 '부캐'로 정의한다. 실존 기자의 부캐를 만들기 위해 최선의 장비를 동원하고, 고품질 고화질의 영상과 음성을 확보해 데이터화(化)하는 작업을 진행한다. 부캐의 활동역역이자 AI뉴스룸의 주요 유통처인 유튜브의 최고 화질을 기준으로 장비를 구성하고 스튜디오 상황에 맞는 녹음 기술도 갖춰야 한다. 

광주 네이버 파트너 스퀘어에서 프라임경제 조택영 기자가 학습용 데이터 생성을 위해 촬영에 임하는 모습. ⓒ 프라임경제


이를 위해 주로 광주광역시에 위치한 네이버 파트너 스퀘어의 스튜디오를 이용한다. 이 곳은 공간을 대여해주며 중소기업의 콘텐츠 제작을 지원하는 목적으로 운영된다. 

그럼에도 필요한 고성능 장비는 임대해 사용한다. 중요한 것은 양질의 '본캐' 데이터를 확보하는 것이기 때문이다. 

신문산업의 투자 활동과 그 결과가 큰 틀에서 변화를 맞이했다. 이전까지 미디어업체의 장비 투자는 콘텐츠 자체를 생산하거나 부가 사용할 소스(Sauce)를 생산하기 위함이었다. 이는 2차 가공의 측면에서도 같은 프레임과 같은 의상 등 데이터에서 컬럼에 해당하는 분류 기준을 설정할 필요가 없었다.

반면 AI뉴스룸 생산자의 입장에서 양질의 데이터를 확보하는데 주력한다. 인물 영상과 음성의 선명함과 규격의 균등함 등 고유의 기술적 기준을 세워 품질을 관리했다. 학습을 위한 데이터로 사용하기 위해 수집 과정부터 컬럼 구조를 고려했다. 

여기에는 카메라와 피사체와의 거리, 공간의 규모와 조명의 조도, 피사체의 메이크업과 앞머리, 의상과의 조화 등 다양한 조건을 고려해야 한다. 

AI뉴스룸은 본캐의 데이터가 선명할수록 부캐 또한 선명하다. 본캐의 사투리가 발화 자체를 망가뜨리지 않는다면, 이를 고유의 정체성으로 인정하고 고치지 않는다. 고쳐서 어색할바엔 자연스러운 선명성이 기자의 부캐에 더욱 적합하다. 

그렇다 보니 최초 데이터 생성에는 많은 시간이 필요하다. 평균 200분 정도의 녹화 시간을 통해 4000여개의 문장을 생성한다. CUDA 기반의 문장 학습과 립페이크, TTS를 동시에 가동하기 위해 NVidia의 초고성능 워크스테이션을 세팅했다. 

무려 글로벌 자동차 제조기업 에스턴마틴의 VR및 MR서비스에 사용된 'RTX A6000'이다. 'i9-12900KS'와 128GB의 메모리가 서포트한다. 평균 60만회, 남성의 경우 90만회 수준의 학습 과정을 거친다. 

그럼에도 학습 시간은 평균 1.84초에 1회, 남성 화자의 경우 1만2600분, 210시간, 8일 18시간이 필요하다. 학습 시간 및 정확도 개선을 위해 추후 AICA(인공지능산업융합사업단)의 컴퓨팅 자원을 이용할 계획이다. 

또한 고품질 데이터는 후작업을 쉽게 만든다. 'AI뉴스룸 생성기'는 숙련된 편집자 1명이 AI캐스터를 생성하고, 자료와 사진 등 외부 소스를 편집해 영상 뉴스 콘텐츠를 만드는 모든 과정이 가능하도록 설계했다.

그 결과 지금까지의 AI뉴스룸은 지금까지 올라온 인공지능 기술을 충분히 사용하면서도, 보통의 의욕 있는 신문사라면 어느 곳이나 운용할 수 있는 수준의 제품으로 제작됐다.

둘째, 프라임경제 기사 전체 데이터화(化)를 통해 기사 자동 생성기에 '논조'를 투영한다. 

GPT API를 이용해 기사 자동생성기를 제작하는 과정에서 학습데이터로 프라임경제 기사의 전량을 사용했다. 기사는 총 5개의 키워드와 기사 대상에 대한 긍정, 부정을 태그한다. 긍정과 부정을 정하는 기준은 제목과 리드문장의 성격을 기준으로 정했으며, 스크랩을 통해 향후 사실관계가 정정된 기사는 데이터에 포함하지 않았다.

문장의 생성만이 목적이라면, 이미 GPT가 학습한 데이터만을 이용해도 무방하다. 또한 언론진흥재단에서 제공하는 '빅카인즈'나 과학기술정보통신부의 'AI HUB'에서 기사 데이터를 받아도 된다. 하지만 생성될 기사가 프라임경제의 기사라는 정체성을 갖도록 하기 위해선 명확한 특정 성향을 갖춘 대량의 학습용 데이터가 필요했다. 

잠시 프라임경제의 성향을 살펴볼 필요가 있다. 프라임경제는 창립 이래 인터넷 통신망의 공공성을 인정해왔다. 가치 있는 구독 공간을 조성하기 위해 배너광고를 걷어냈고, 정보 접근성 개선을 위해 독자 눈높이를 발달장애인 수준으로 낮춘 '우리모두뉴스'를 서비스했다. 읽을 만한 기사를 읽고 싶은 환경에서 말 그대로 누구나 읽을 수 있도록 하고자 노력해온 과정이 프라임경제의 정체성이 담긴 '논조'가 됐다.

셋째, 소프트웨어를 직접 구축해 전문성의 수준을 높인다. 

종사자 가운데 문과출신의 비중이 높은 뉴스 시장의 특징으로 인해 개발자들은 이 시장을 '소프트웨어와 융합이 무척 어려운 분야'로 느끼기 마련이다. 특히 대다수의 매체는 아직도 업무에 필요한 지식을 도제식 시스템을 통해 전달하고 있다.

프라임경제의 AI뉴스룸 TTS 생성기는 현직 기자들의 요구에 따라 스크립트 문어체 변경기능을 갖추고 있다. ⓒ 프라임경제


이 상투적 전통은 미디어테크가 'DeVops'를 반드시 필요로 하는 영역임에도, 기자들에게 꼭 필요한 기능이 정확하게 무엇이라고 설명하기 어렵도록 만든다. 말로 설명하기조차 어려운 기자의 촉이 발동된 원인을 개발자가 이해하기 위해서는 많은 노력과 인내에 기반한 이해가 뒷 받침 돼야 한다.

더욱 곤란한 지점은 펜기자와 사진기자, 영상기자 등 직무로 소통의 방법을 구분하는 구조다. 대부분의 매체는 직무에 따른 특화 구분을 아직 살려두고 있다. 때문에 지금 시점의 기술 고도화에 기반한 미디어 믹스는 전문성과의 결합까지 고려해야 하는게 아닐까라는 부담이 발생한다.

유연성을 갖추기 위해서는 포토 저널리즘, 영상 저널리즘을 구분할 것이 아니라 독자의 소비 환경에 따라 자연스럽게 발생하는 미디어믹스를 이해하는 상황인식이 필요하다. 

예컨데, 최고의 사진을 건진 사진기자가 요구하는 용량의 사진 웹 게시를 위해선 지금보다 수 십배의 웹 자원이 필요하지만, 영상 편집자의 입장에선 1초 남짓의 소스에 불과할 수 있다.

실제 과거를 돌아보면 초기 미디어 믹스는 방송사의 주도로 기술적 한계를 물리적 투자로 극복했다. 그 시절에도 라디오 중심 생태계의 저항은 강력했다. 하지만 상업방송이 시작된 이래, 가장 유명한 캐치프라이즈는 버글스의 'Video Killed the Radio Star'로 결론났다. 

40년이 지난 현재의 반전은 대자본 중심 방송 고유의 장점이 대부분 사라지는 시대에 돌입했다는 것에 있다. 모든 사람이 상업방송을 갖게 된 현재는 'YouTube Killed the Video Star'가 진실이 되고 있다. 

글과 사진, 사진과 영상, 이후 추상(액자 밖 영역)의 영역이 포함 될 것에 대한 대비가 필요하다. ⓒ 프라임경제


5년전, 프라임경제는 영상 콘텐츠에서 사용할 수 있는 TTS의 생성과 유통, 보안에 이르기까지 광범위한 '기술 특허' 확보를 시작했다. 이 중 핵심 특허는 미국과 일본에서도 등록됐다. AI분야에서 압도적 격차가 발생하기에 충분한 기간이다. 

모든 기자가 원하는 영상 콘텐츠를 만들 수 있는 AI가 프라임경제에겐 목전이다.

앞서 양질의 데이터를 수집하는 것은 좋은 토양을 만드는 것과 같다. 언제 어떠한 목적으로도 사용될 수 있도록 최선으로 준비한다. 또 프라임경제의 논조를 이식하는 과정은 분명한 정체성을 통해 소구력을 만들려는 목적이 반영됐다. 마지막으로 소프트웨어를 직접 개발해 전문성을 확보하는 까닭은 후발 업체와의 경쟁력을 확보하기 위함이다. 

선도자는 보통 자신과 다른 사람을 위해 첫 발을 내딛은 가치로 인정받는다. 4년전 AI뉴스룸은 누구도 가지 않은 길을 걷기 시작했고, 언론진흥재단을 통해 그 결과를 세상에 구체적으로 소개할 수 있게 됐다.

이 기사로 프라임경제가 AI뉴스룸과 같이 콘텐츠 자동 생성 도구를 구상하는 매체들에게 선도자의 길을 가고 있음을 기억해 주길 기대해본다. 


“본 기획물은 정부광고 수수료로 조성된 언론진흥기금의 지원을 받았습니다.”
  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지