• 페이스북
  • 트위터
  • 유튜브

바이브, 한국형 생성AI 언어모델 공개…"보안·환각 해결"

등록 2023.06.05 10:49:33

  • 이메일 보내기
  • 프린터
  • PDF

바이브 서치GPT, 원문 데이터 출처 함께 제시

"바이브 서치GPT 탑재한 새로운 검색서비스 곧 출시"

바이브, 한국형 생성AI 언어모델 공개…"보안·환각 해결"


[서울=뉴시스] 오동현 기자 = 바이브컴퍼니가 자체 생성형 인공지능(AI) 언어모델 '바이브GeM'을 최초 공개했다.

바이브는 지난 2일 인공지능·빅데이터 연구소 주관의 기술 워크숍 '바이브 테크데이(VAIV Tech-day)'를 통해 바이브GeM과 뉴럴서치(신경망 검색)·언어생성 기술을 결합한 '바이브 서치GPT'를 함께 공개했다.

바이브의 기술은  최근 생성형 AI가 직면한 보안이나 할루시네이션(환각) 이슈 등의 문제를 보완한 것이 특징이다.

챗GPT의 등장은 전 산업군에 AI 수요를 불러왔지만 특히 공공기관이나 대부분의 기업에서는 데이터 유출 등 보안 문제로 당장의 도입은 꺼려하는 분위기다. 바이브 서치GPT는 머신러닝 과정에서 데이터가 외부에 공개되는 것을 원하지 않는 기업이나 기관에 최적화된 형태인 온프레미스(사내구축형)로 제공돼 보안 이슈에서 자유롭다는 장점이 있다.
 
또 바이브 서치GPT는 AI 언어모델이 잘못된 정보나 허위 정보를 생산하는 할루시네이션 문제를 개선했다. 답변의 근거가 되는 원문 데이터의 출처를 함께 제시해 신뢰성을 높였다.
 
바이브GeM은 매개변수를 줄이고 미세조정으로 정확도를 높인 맞춤형 대규모 언어모델(LLM)로, 기존 LLM 대비 머신러닝에 소요되는 시간과 비용을 줄였다.

코어 기술인 바이브GeM은 한국어 특화 언어모델이다. 바이브는 20년 이상 비정형 데이터를 수집하고 분석하는 연구 개발을 통해 다양한 빅데이터 분석 모델 개발 사업을 진행, 2020년과 2022년 과학기술정보통신부가 주관하는 AI 학습용 데이터 구축 지원 사업을 마무리했다. 또 지난해 한국어 기계독해 성능 테스트인 코쿼드1.0에서 국내 1위를 차지했다.

바이브는 뉴럴서치 서비스 '바이브 서치'도 곧 선보일 계획이다. 바이브 서치는 사용자가 궁금한 질문을 문장 형태로 입력하면 정답이 있는 문서를 찾아줄 뿐만 아니라 바이브 서치GPT를 탑재해 답변을 단 몇 줄로 요약까지 해주는 검색 서비스다. 기존 키워드 기반의 검색 서비스와 달리, 사용자가 여러 문서를 찾지 않아도 한눈에 원하는 정답을 찾아준다는 특징이 있다.

이외에도 바이브GeM을 기반으로 시장의 수요에 맞는 ▲AI가 데이터의 수집, 분석부터 리포트까지 작성해주는 '바이브 리포트 코파일럿' ▲AI 대화 솔루션 '바이브 챗봇' ▲사용자가 원하는 뉴스를 선별해 요약해주는 '바이브 뉴스다이제스트' 등 다양한 솔루션과도 결합해 제공할 계획이다.

 윤준태 바이브 인공지능·빅데이터 연구소 부사장(CTO)은 “바이브의 생성형 AI 언어모델을 활용하면 다양한 산업 도메인에서 적은 비용으로 각 기업, 기관들이 특화된 언어모델을 자체 구축할 수 있다는 장점이 있다"며 "바이브GeM을 지속적으로 고도화해 법률, 금융 정보 같은 전문 분야 특화 모델도 선보일 계획"이라고 말했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사