"산업별로 특화된 LLM"…전문영역 'AI혁신' 솔루션 눈길
방대한 데이터 학습하는 범용 LLM 한계
법률·게임 등 전문 영역 특화해 효율성↑
[서울=뉴시스] 인공지능 이미지. 해당 사진은 기사와 관련이 없습니다. 2024.11.22. (사진=픽사베이)
*재판매 및 DB 금지
[서울=뉴시스]권안나 기자 = 인간의 언어를 이해하고 생성하도록 훈련된 인공지능(AI)과 거대 언어 모델(LLM)의 등장은 자연어 처리 기술(NLP)의 급격한 발전을 이끌고 있다. LLM은 데이터를 다루는 산업 전반에서 활용되며 'AI 혁신' 움직임을 뒷받침한다.
특히 최근에는 보안, 법률, 게임 등 특정 도메인에 특화된 형태로 LLM이 한층 정교하게 발전하고 있다. 범용 LLM의 경우 방대한 데이터를 학습하는 만큼 심층적인 전문 지식이 필요한 영역에서 한계가 있기 때문이다.
22일 관련 업계에 따르면 각 산업별 특수성을 반영한 전문 지식과 데이터를 학습시켜 한층 정밀한 특수 LLM을 구축하는 사례가 늘고 있다.
보안 전문 데이터 기업 S2W는 세계 최초의 다크웹 전용 AI 언어 모델 '다크버트(DarkBERT)'를 개발해 주목받고 있다. 다크웹은 마약 유통, 랜섬웨어, 해킹 등 각종 사이버 범죄의 온상으로 지목되고 있다. 난해한 언어와 불법적인 콘텐츠가 난무하고 있어 분석이 어렵다.
다크버트는 다크웹에서 수집된 약 3억개 페이지의 방대한 텍스트 데이터로 훈련됐다. 다크웹 페이지 주제 분류와 랜섬웨어 유출 사이트 탐지 등 우수한 분석 성능으로 사이버 범죄 수사의 효율성을 강화하고 있다.
S2W가 다크버트에 이어 공개한 사이버 보안 특화 AI 언어 모델 ‘사이버튠(CyBERTuned)'은 비정형 사이버 보안 데이터, 비언어적 요소를 효과적으로 학습할 수 있도록 설계됐다. 사이버 위협 인텔리전스 작업에서 차별화된 기능을 보여준다.
S2W는 최근 사이버 안보 특화 언어 모델들을 개발하며 축적해온 NLP 기술 노하우와 특수 데이터 처리 역량을 제조, 유통, 금융, 공공 등 다양한 산업군으로 확대해 적용하고 있다.
법률 시장에 특화된 LLM으로 법무 효율성을 극대화한 서비스형 소프트웨어(SaaS) 플랫폼도 있다. 리걸(법률) AI 솔루션 기업 BHSN이 개발한 '앨리비(Allibee)'는 법률 계약서 업무에 최적화된 기능을 제공한다.
앨리비는 BHSN이 자체 개발한 법률 특화 AI 언어 모델 'BHSN Legal-LLM'을 기반으로 구축됐다. 계약, 법령, 판례, 정책 등 변호사와 AI 엔지니어가 협업해 선정하고 생성한 대량의 법률 관련 고품질 데이터를 집중적으로 학습했다.
정확도 높은 정보를 바탕으로 법률 영역에 적합한 세부 기능을 구현했다. 기업, 공공기관, 로펌 등 다양한 고객사의 데이터를 토대로 내부 정책에 맞춰 계약서 내용을 수정하는 등의 서비스도 제공하고 있다.
게임 분야에 특화된 LLM 모델도 있다. '바르코 LLM'은 엔씨소프트가 국내 게임사 최초로 자체 개발한 AI 언어 모델이다. 게임 개발에 특화된 고품질 콘텐츠 제작을 지원한다.
바르코는 텍스트나 시나리오 등 게임 내 콘텐츠 개발에 중점을 둔 데이터를 학습했다. 생동감 있는 기획, 운영 등 콘텐츠 개발 전반에서 높은 효율성을 제공한다.
바르코 LLM은 게임 콘텐츠 생성에 특화된 언어 모델이지만 차량용 플랫폼, 교육 등의 분야와도 도메인 특화 모델 개발을 위한 업무협약을 체결하는 등 다양한 산업에 적용되고 있다.
엔씨소프트는 향후 바르코를 개발한 AI 연구개발 조직 'NC 리서치'를 자회사로 분사해 AI 전문 기업을 신설하고 관련 기술을 고도화한다는 계획이다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지