네이버 클로바·서치, 국제 전산언어 학술대회 '콜링'서 논문 발표
라인과 가장 높은 등급으로 후원…국제 최고 수준 학술대회
10월12일~17일까지 경주서 최초로 국내 개최
클로바 논문 2편·서치 1편 발표…부스 통해 자연어처리 연구자와 교류
[서울=뉴시스] 네이버가 라인과 공동으로 국제전산언어학술대회 '콜링(COLING) 2022'에 가장 높은 후원 등급인 ‘그랜드 챌린지’ 스폰서로 참여하고, 클로바 논문을 발표했다고 14일 밝혔다.(사진=네이버 제공).2022.10.14 *재판매 및 DB 금지
[서울=뉴시스]최은수 기자 = 네이버가 라인과 공동으로 국제전산언어학술대회 '콜링(COLING) 2022'에 가장 높은 후원 등급인 ‘그랜드 챌린지’ 스폰서로 참여하고, 클로바와 서치 논문을 발표했다.
‘콜링’은 자연어처리 및 전산언어학 분야의 국제 최고 수준 학술대회로, 전 세계 연구진과 산업 관계자들의 성과를 발표하고 인사이트를 공유하는 장이다.
올해 학회는 10월 12일부터 17일까지 경주 화백컨벤션센터(HICO)에서 온라인 및 오프라인 하이브리드 형식으로 개최된다. 29회째를 맞이하는 올해 학회는 최초로 국내에서 개최돼 국내 전산언어 관련 산업 발전과 인재양성에 긍정적인 효과를 가져올 것으로 기대를 모으고 있다.
이번 학회에서 클로바 CIC는 논문 2편 ▲‘세분성(Granularity) 개념 기반의 문장 분해를 통한 언어 모델의 해석 가능성 및 성능 강화 연구'(Continuous Decomposition of Granularity for Neural Paraphrase Generation) ▲‘언어 모델 성능 향상을 위한 메타데이터 활용 모델 인젝터 개발 연구'(Attribute Injection for Pretrained Language Models: A New Benchmark and An Efficient Method)을 발표했다.
먼저 '세분성(Granularity) 개념 기반의 문장 분해를 통한 언어 모델의 해석 가능성 및 성능 강화 연구' 논문은 문장의 의미적인 부분과 형식적인 부분을 '세분성(granularity)'이라는 개념을 통해 구분하고 언어 모델의 해석 가능성을 높인다는 내용을 담았다. 또 개선된 성능의 언어 모델을 만드는 연구. 일반적인 자연어 처리 응용의 해석 가능성 강화와 성능 강화에 사용될 수 있다.
또 다른 논문 '언어 모델 성능 향상을 위한 메타데이터 활용 모델 인젝터 개발 연구'는 메타데이터를 활용해 언어 모델의 성능을 높이는 모델 인젝터를 개발했다.
예컨대, 쇼핑 등의 애플리케이션을 개발하는 상황에서 유저 정보나 제품 정보들을 언어 모델에 산입해 제품의 평가나 분류 예측 능력을 높이는 데 사용될 수 있다. 또한, 메타데이터를 활용하는 8개의 데이터셋으로 구성된 새로운 벤치마크셋을 제안할 수 있다.
네이버 서치 CIC도 ‘사실검증을 위한 의미론적 삽입 선택적 그래프 추론(SISER: Semantic-Infused Selective Graph Reasoning for Fact Verification)’ 논문을 발표했다. 전북대와 산학협력으로 문서에서 추출한 QA나 하이파클로바와 같은 생성 모델로 만든 답변을 검증하는 용도의 기술을 연구하는 내용이 담겼다.
지난 13일 인더스트리 세션에서는 강인호 네이버 서치 CIC 책임리더가 ‘하이퍼클로바’와 같은 초거대 언어모델을 이요한 검색 서비스 개발 사례와 멀티 모달 검색 서비스 ‘옴니서치’를 소개하는 구두 발표를 진행했다.
아울러 네이버 클로바, 네이버 서치, 라인은 이번 학회에서 각각 부스를 열고 전세계의 자연어처리 분야 연구자들을 대상으로 기술교류 및 채용활동을 전개하고 있다.
한편 네이버는 라인과 공동 후원금 2만5000달러를 마련했다. 이 후원금은 ‘콜링 2022’의 특별 주제인 ‘UN 지속가능성 목표의 관점에서 본 전산언어학 연구’ 장려를 위해 진행되는 ‘그랜드 챌린지’ 프로그램에 기여될 예정이다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지