• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

GPT 광풍 속 BERT의 진실

사용자 목적 따라 차이…거품 경계 우려도

김수현 기자 | may@newsprime.co.kr | 2023.02.16 09:51:12
[프라임경제] 챗GPT 신드롬으로 챗봇 업계가 분주한 가운데 관계자들의 고심이 깊다. GPT 키워드에 투자자들의 관심이 쏠리면서 타 언어모델을 사용하는 업체들이 '후발주자'로 비칠 수 있다는 걱정이다. 몇몇 전문가들은 지금 현상이 전방위적 광고·선전에 의한 거품이라는 점을 경계해야 한다며 우려의 시선을 보내고 있다.

◆ GPT‧BERT, 목적 따라 달라

화제가 된 챗GPT 모델은 오픈AI의 GPT-3.5를 기반으로 제작됐다. GPT-3의 방대한 데이터 처리 능력을 바탕으로 기존에 있던 AI 챗봇을 압도하는 성능을 보이는 게 포인트다. 여기에 GPT-3의 단점으로 지적되던 '기계스러움'을 벗어던졌다.

언어모델은 범용성과 기업의 특수목적 그리고 비용과 개발시간, 답변의 정확도 등 사용자의 목적에 따른 판단이 필요하다. ⓒ 연합뉴스


여기서 초점은 'GPT'라는 언어모델인데, 이는 다른 언어모델과의 '진보'를 의미하진 않는다는게 업계의 중론이다. GPT와 비슷한 성능의 언어모델이 많다는 점이 AI 전문가들이 신중한 입장을 보이는 이유다. 그 중에서도 대표적인게 GPT와 BERT모델이다.

GPT(generative Pre-trained Transformer)는 generative라는 뜻과 같이 생성형 언어모델을 대표한다. 단어 하나가 주어지면 AI가 수백만 개의 웹페이지로 구성된 방대한 데이터베이스를 통해 인간과 비슷한 대화를 생성한다. 쉽게 말해 질문에 정확한 답이 아니더라도 일상생활 등 다양한 방향성을 갖춘 언어모델이다. 

반면 BERT(Bidirectional Encoder Representations from Transformers)를 대표하는 단어는 Encoder다. 어떤 대상의 목적에 대한 질문에 집중된 언어모델이다. 다양한 문장력에서는 GPT보다 떨어지지만, 특정 주제에 대해서는 더 적은 비용과 리소스로 대응할 수 있다.
 
장단점도 극명하다. GPT 언어모델에서 만들어진 챗GPT는 초거대모델 기반의 범용성 확보가 목표다. 다만 기업들이 이용하기에는 부담이다. 자사 제품과 서비스에 집중된 언어모델이 아니어서 갭이 발생할 수 있어서다.

반면 BERT는 풍부한 답변 능력이 없다는게 단점이다. 하지만 기업에서 사용하기에 큰 변수가 없다는게 장점으로 꼽힌다. 

한마디로 범용성과 기업의 특수목적 그리고 비용과 개발시간, 답변의 정확도 등 사용자의 목적에 따라 트렌스포머 기반의 GPT냐, BERT 등이냐에 따른 판단이 필요하다는 얘기다.

◆ 자금 쏠림에 실적 부풀리기까지…'광풍' 지적

문제는 이같은 언어모델의 차이점에 대한 인식이 부족한 상태에서 챗GPT 광풍이 몰아치고 있다는 점이다. 관련 업체의 주가가 폭등하고, 확인되지 않은 실체를 근거로 챗GPT연관 모델을 발표하는 기업도 등장했다. 

지난 10일 한국거래소에 따르면 마인즈랩(377480)의 주가는 올해 들어 80% 급등했다. 솔트룩스(304100)는 94% 뛰었다. 코난테크놀로지(402030)는 무려 265% 폭등했다. 셀바스AI(120%), 데이타솔루션(88%) 등도 챗GPT 관련주로 엮이면서 급등세를 시현했다. 

사정이 이렇자 일부 업체들은 실체를 확인시켜주지 않고 챗GPT연관 모델 발표부터 하고 있다. 시장 분위기에 편승하려는 의도가 있다는 것이 업계 관계자의 말이다. 

모 업계 관계자는 "투자자들의 과도한 자금 쏠림 현상과 실적 부풀리기가 나타날 수 있어 우려가 된다"며 "과거 '메타버스 돌풍' 때처럼 버블이 발생할 수 있다"고 지적했다. 이는 현재의 챗GPT에는 아직 최신 정보가 제공되지 못한 상태라서 답변에 대한 부족한 점이 나올 수 있다는 우려다. 지금의 최신정보는 다음 버전에서 아직 훈련중이라는 얘기다. 

또 다른 관계자는 "언어모델을 구분하는 기준은 트랜스포머 구조를 어떻게 설계하느냐에 따라 무궁무진하게 달라질 수 있는 부분이다. 어떤 업체든지 해당 알고리즘을 가져다 지원해 오픈하는 것은 사실 아무런 기술적 쟁점이 되지 못한다"며 "정작 중요한 것은 최신정보에 대한 업데이트 능력으로 지금의 모델을 은행이나 공공기관에서 바로 사용할 수 있는 수준은 아닐 것"이라고 지적했다.

  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지