생성형 AI로 국가통계 쉬워질까…통계청, '환각' 없앤 챗봇 연내 선보여
AI, 국가통계 배포·대국민 서비스 활용 가능성↑
유럽 통계청들 "정보 품질관리·정확도는 우려"
통계청, 부정확도·편항 없앤 대국민 챗봇 준비 중
[서울=뉴시스] 사진은 제13회 국가통계발전포럼 모습. (사진=통계청 제공) *재판매 및 DB 금지
[서울=뉴시스]임하은 기자 = 우리나라 챗GPT 사용자가 300만명을 넘은 가운데, 생성형 인공지능(AI)을 국가 통계에도 어떻게 활용할 수 있을지에 대한 논의가 활발히 진행 중이다.
통계청은 올해 연말까지 대국민 통계 제공 서비스에 AI를 접목한 '통계챗봇'을 선보인다는 계획이다. 통계청 내 자료로만 답변하도록 해 편향과 부정확성 등 논란의 소지를 없앤다.
통계청은 6일 서울 엘타워에서 한국통계학회, 한국조사연구학회와 공동으로 제13회 국가통계발전포럼을 열어 이 같은 내용의 AI를 활용한 국가통계 서비스 방안을 논의했다.
이날 특별 강연에는 '세계 각국 통계청 활용 동향과 향후 과제'라는 주제로 최인경 유럽경제위원회(UNECE) HLG-MOS 사무국장이 나섰다.
최인경 국장은 유엔 유럽경제위원회에서 '공식통계 현대화를 위한 고위급 그룹'(HLG-MOS)에서 일하고 있다. 이는 유엔 사무국의 유럽 지부격으로, 국가의 통계 시스템 발전을 지원하는 조직이다.
생성형 AI는 전문가 집단을 위한 도구가 아니라 일상적 도구가 된 지 오래다. AI 기법은 점점 더 어려워지고 있는데, 사용의 접근성은 반대로 더 쉬워지고 있다.
이런 상황에서 국가통계의 생산성과 효율성 향상을 위해 생성형 AI를 어느 방면으로 활용할 수 있을지에 대한 논의가 우리나라에서도 다방면으로 이뤄지고 있다.
유럽 국가들도 사용자가 생성형 AI로 자연어를 통해 데이터를 쉽게 찾도록 사용자 경험을 개선하고 있다.
최 국장은 "유럽 통계 기관장 회의에서 한 조사에 따르면 지난 2~3년간 생성형 AI가 업무 분야에 영향을 미칠 것으로 예상되는 부문은 코딩과 정보기술(IT) 개발, 배포와 커뮤니케이션이었다"며 "통계 기관의 주요 소임은 좋은 품질의 통계 제공도 있지만 이용자들이 (데이터를) 잘 찾고 다운 받을 수 있도록 제공하는 것도 포함된다"고 설명했다.
[서울=뉴시스] 이형일 통계청장과 김동욱 한국통계학회장, 서우석 한구조사연구학회장, 이준기 연세대 졍보대학원 교수, 최인경 UN 유럽경제위원회(UNECE) 사무국장이 6일 제13회 국가통계발전포럼에서 토론하고 있다. 2024.09.06. (사진 = 통계청 제공)
유엔 유럽경제위원회 설문조사에 따르면 생성형 AI를 국가통계에 적용하는 데 있어 가장 우려되는 지점은 정확도와 정보 보호다.
국가통계기관은 정보 품질 관리 문제가 중요한데, AI 모델은 100%의 정확도를 보장할 수 없는 점, 훈련 자료에 내재한 편항과 오류의 문제도 존재한다. 또 생성형 AI를 사용하다보면 코딩 과정에서 정보가 유출되는 문제도 있을 수 있다. 이런 정확성의 측정과 품질 관리 보완 방안이 향후 과제로 꼽힌다.
통계청은 국가통계의 처리 과정과 대국민 통계 제공 서비스에서 AI를 활용하기 위한 연구를 지속해왔다. 지난 2022년부터는 데이터 처리 실무에서 AI를 실제 도입해 AI 기반 통계분류 자동화시스템을 운영하고 있다.
이형일 통계청장은 이날 전체토론 시간에 "통계청도 데이터 처리에 있어서 AI를 도입 중이다. 수백만 가지 데이터를 코드분류하는 과정에 3~4년 전부터 AI 도입 실험을 했고, 유효한 시스템을 만들어서 올해부터 지역별고용조사 등에 활용하고 있다"고 설명했다.
아울러 통계청은 대국민 서비스에 AI를 접목한 통계챗봇을 올해 연말에 선보이기 위해 준비 중이다. 특히 생성형 AI가 잘못된 정보를 사실처럼 출력하는 '환각' 현상을 방지하기 위한 작업을 진행 중이다. 국가통계 분야에 대규모언어모델(LLM) 기술을 활용하는 사례는 국제적으로 드물다.
이 청장은 "대국민 서비스는 굉장히 어려운 영역이다. 챗봇에 AI를 담으면 어떻게 될지를 작업하고 있고, 연말에 선보이려 하는 상황"이라며 "실제 데이터를 찾아주는 것까지 생각하고 있는데, 환각을 방지하기 위해 통계청 내에 있는 데이터로만 답변하도록 한다. 데이터가 없으면 모른다고 답변하는 알고리즘을 만들어 환각을 제외하는 것을 목표로 하고 있다"고 설명했다.
그러면서 "국가승인통계를 처음부터 끝까지 AI로 활용하는 건 아직은 없다"며 "통계청에서 연구 중인 것은 온라인플랫폼에서 거래되는 (상품·서비스의) 가격을 AI 기능을 탑재해 조사해보려 연구 중인 사안이 있다"고 덧붙였다.
[서울=뉴시스] 이형일 통계청장이 6일 제13회 국가통계발전포럼 전체토론에서 발언하고 있다. 2024.09.06. (사진 = 통계청 제공)
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지