[AI 2.0 시대⑤]네이버 AI가 유독 한국어에 강한 이유

등록 2022.06.27 06:01:00수정 2022.06.28 10:55:48

[인터뷰]성낙호 네이버 클로바 CIC 책임리더

미국 GPT-3 출시 계기로 개발 착수해 국내 최초 출시…초거대 AI 개발 총괄

"네이버 AI에 한국인 정신 구워져 있어…데이터 주권에 이어 AI 주권 확보 선도"

"초거대 AI 이슈 띄워…미국 다음으로 한국 가장 활발하게 된 배경"

"클로바 스튜디오로 '모두를 위한 AI' 구현하는 데 현재 가장 역점"

"AI가 인간을 초월한다고? AI는 도구일 뿐"

▲성낙호 네이버 클로바 CIC 책임리더

[서울=뉴시스]이진영 기자 = 지난해 5월 '하이퍼클로바'라는 초거대 인공지능(AI)을 국내 최초로 내놓은 네이버. 하이퍼클로바 개발을 전향적으로 제안해 현재까지 총괄하고 있는 성낙호(44) 네이버 클로바 CIC 책임리더는 "네이버의 AI엔 한국인의 정신이 구워져있다(=녹아있다)"라고 표현했다.

또 "네이버가 초거대 AI에 대한 국내에 관심을 일으켰고 이제는 카카오, LG, KT 등 여러 토종 기업이 뛰어들었습니다"면서 "미국 빼고 한국이 초거대 AI에 가장 열심히 하고 있는 나라가 됐어요. 대한민국의 AI 주권은 이제 걱정해야 하는 수준에서는 벗어났다고 볼 수 있다"고 알렸다.

성 리더와 지난 22일 판교에 소재한 신사옥 1784에서 만나 인터뷰를 진행했다.

내로라 하는 AI 전문가라면 해외 유명 대학에서 건너온 유학파를 떠올릴 지 모르겠지만 그는 순수 국내파다. 서울대학교에서 컴퓨터공학과를 졸업했을 뿐이다. 하지만 초거대 AI에 대한 답변에는 제대로 해본 사람에게서만 볼 수 있는 자신감과 경험, 통찰력이 역력했다.

-네이버가 초거대 AI를 가장 먼저 출시했다. 계기는 무엇인가.

"2020년 5월 미국 오픈 AI가 공개한 초거대 AI 모델의 원조 'GPT-3'를 보고 느낌을 확 받았습니다. GPT-2만 해도 그냥 그림, 글씨를 복제하는 수준이었죠. 하지만 GPT-3를 테스트해보니 완전히 차원이 다르더라고요. 대본과 등장인물을 제시하면 대사를 연결하는 것 뿐만 아니라 등장인물의 감정 상태를 인지, 표현하는 것도 능히 해내더라니까요. 한국인을 캐스팅해 넣으면 한국인에 걸맞은 이름도 GPT-3가 붙여줬어요. 테스트를 굉장히 많이 했는데 '완전 새로운 게 나타났구나'라는 느낌이 왔어요. 실제 당시 이런 것도 될까라고 상상했던 것들이 지금 다 서비스로 구현되고 있습니다."

"초거대 AI 개발을 시작한 건 당시 진짜 큰 베팅이었어요. GPT-3가 공개됐을 때만 해도 GPT-2와 차별화되는 혁신성 자체에 대한 의구심이 상당했죠. 또 그냥 컴퓨터에 다 밀어넣으면 되는거냐라면서 빅모델로 하는 것은 바보들이 하는 거라고 여기는 게 일반적인 인식이었어요. 네이버 내부에서도 부정적인 시선이 많았어요. 하지만 이 정도면 해볼만한 프로젝트라고 보고 GPT-3가 나온 지 2달여 만인 2020년 7월 프로젝트로 설계해서 경영진에 제안을 했죠."

-'하이퍼클로바' 프로젝트 제시했을 때 경영진의 첫 반응은 어땠나

"첫 발표를 듣고 경영진의 첫 반응은 '글로벌에서 경쟁하려면 이 정도는 당연히 해야지, 할 수 있는 수준'이라고 결론을 내주셨습니다. 얼마짜리 프로젝트인지도 가늠이 되지 않은 프로젝트였는데 당시 분위기상 진짜 큰 베팅이었습니다. 그 후 일사천리로 진행됐습니다. 2020년 9월 경영진이 최종 OK 결정을 내렸죠. 그리고 하이퍼클로바 개발을 위한 슈퍼컴이 10월 도입됐고 바로 개발에 착수했습니다. 그리고 GPT-3가 나온 지 딱 1년 만인 지난해 5월 독자적인 초거대 AI를 개발해 내는 데 성공했습니다."

-경영진이 슈퍼컴까지 사주며 프로젝트에 힘을 실어줬다는 건 어떤 측면에서 강하게 공감했기 때문 아닌가.

"반도체 산업을 비유로 들었던 게 먹혔던 거 같습니다. 반도체가 기술적으로 펀더멘털한 게 바뀐 건 하나도 없고 나노미터까지 집적도를 늘린 것밖에 없어요. AI도 사이즈의 가속화가 지금의 추세입니다. 그렇다면 우리도 동참해야 하지 않을까. 이걸 하지 않으면 '플랫폼머'(Platformer)가 아니라 '사용자'(User)로 전락하게 된다. 우리가 이 정도 연구개발은 해봐도 되지 않겠냐는 말에 공감했던 것 같습니다."

-자본력으로 무장한 빅테크들과의 AI 경쟁 두렵지 않았나.

"저희가 AI 논문 60여편 정도 하는데 구글 여기에 '0'이 하나 더 붙는 수준으로 하고 있죠. AI가 단순히 사람에 의해서 되는 거라면 싸워 이길 수 없죠. 하지만 데이터와 자본의 결합이라고 하면 해 볼 만하다고 봐요. AI 개발이 생각보다 자본이 그렇게 많이 들지 않아요. 반도체 공정을 지어야 할 정도로 투자를 해야 하는 건 아니니까."

"또 AI는 인프라 투자적인 측면이 있습니다. 기본으로 쓰는 AI 모델이 커지면 추가적으로 알려줘야 되는 데이터의 양이 줄어들어요. 그래서 AI 투자는 공동 인프라 투자라고 볼 수 있죠. 다시 말해 인프라가 안 깔려 있을 때는 하나하나 할 때 비용이 많이 드는데 인프라적인 측면에서 크게 한 번 투자해 놓으면 개별 문제를 푸는 비용이 훨씬 저렴하죠. 하나를 알려주면 열을 하는 게 가능해지는 거죠."

▲성낙호 네이버 클로바 CIC 책임리더

-네이버의 AI 경쟁력은 어느 수준으로 보나

"네이버 AI 논문 수도 국내에서는 단연 톱 클래스라고 생각합니다. AI업계에서는 세계적으로 네이버를 모르는 곳이 없고, 빅테크들도 대등하게 인정해주는 파트너가 자리잡았어요. 오히려 글로벌에서는 네이버가 검색 회사인지 모르고 AI 회사로 알려져 있다고 하더라고요. (웃음). 특히 네이버는 초거대 AI 기술을 서비스에 적용, 즉 상용화 수준은 세계에서 제일 빠르다고 자부합니다."

-언어 뿐 아니라 시각, 청각 데이터를 모두 포함하는 '초거대 AI 멀티모달' 개발 경쟁이 활발한 것 같다.

"현재는 큰 관심 없습니다. 우리도 충분히 할 수 있지만 굳이 열심히 하고 있지는 않죠. 경쟁사들이 초거대 AI가 그림을 그릴 수 있다고 하는데 이걸 이용해 뭘 할 수 있는지 막연합니다. 네이버는 AI 연구를 위한 연구를 하는 것이 아니라 실용성을 고민하는 것이 타사와의 차이입니다. 또 그림, 이미지 등이 재산권, 저작권 등 침해의 소지가 될 게 너무 많습니다. 멀티모달이 현실적인 측면에서 상당히 그레이(Grey: 모호)하다고 알려진 것도 이 때문이죠.

-네이버가 데이터 주권, 더 나아가 AI 주권 측면에서 많은 역할을 하고 있다.

"국내 1위 플랫폼 기업으로서 주권에 대한 고민 많이 하는데 너무 몰라주는 것 같네요. AI가 발전을 하면 능력을 배가시켜주는 즉 생산성과 직결되는데, 이게 언어나 문화에 따라 차별을 받게 되는 상황을 일찍부터 우려해왔습니다. 지금만 보더라도 구글이 클라우드 기반 응용프로그램(API)을 제공하지 않는 언어가 매우 많습니다. 또 구글이 제공하는 서비스가 영어랑 한국어랑 질이 달라요. 단순히 인식이나 합성, 번역 정도에서 벗어나 코딩을 도와준다든가 문서를 대신 써준다든가 등 우리가 지적 활동이라고 부르는 영역에서 AI가 활용된다면 그 생산성 격차는 더 커질 것입니다."

-한국어가 초거대 AI 개발에 장애였나

"처음에는 많은 사람들이 지장이 있을 거라고 생각했었어요. 한국어가 워낙 복잡하고 생략도 많고 전통적인 자연어 하시는 분들 시대에는 그렇게 여겼는데 우리는 언어에 대한 장벽은 없다고 판단합니다. 데이터만 있으면 언어가 아무리 복잡해도 난이도는 큰 차이 없습니다."

"네이버의 AI에는 네이버의 데이터를 넣었잖아요. 국내 최대 플랫폼 기업인 네이버의 데이터에는 한국인들의 집단 지성이 그 어떤 플랫폼보다 가장 많이 녹아 있어요. 그렇기 때문에 네이버의 AI에는 한국인의 정신이 구워져 있다(baked)고 볼 수 있죠. 외국 플랫폼이 만들었다면 한국의 정치나 문화가 많이 빠져 있을 거예요."

-네이버가 AI 영역에서 현재까지 선도적이었다. 앞으로의 미래가 궁금하다.

"지금 저희가 하고자 하는 것은 IT 붐 이후 지금 살아남은 미국 빅테크들밖에 안 남았습니다. 앞으론 AI가 새로운 계기를 만들 것입니다. 저희가 개발한 초거대 AI를 네이버만 쓰면 안 되고 좀 다양한 기업들이 많이 써서 기회를 찾도록 하는 것을 모색하는 데 역점을 두고 있습니다. 그런 목적에서 내놓은 것이 '클로바 스튜디오'입니다."

-'클로바 스튜디오'란 무엇인가

"지난 2월 하이퍼클로바를 활용할 수 있는 '노 코드(No Code) AI' 도구인 클로바 스튜디오를 클로즈드 베타 서비스를 출시했습니다. 자체 초대규모 AI 하이퍼클로바를 다양한 네이버 서비스에 적용한 데 이어, 스타트업 등 외부 파트너들이 쉽게 활용할 수 있도록 제공해 ‘모두를 위한 AI’를 구현하고 초대규모 AI 생태계를 조성하고자하는 것입니다.

"클로바 스튜디오 플랫폼에서는 개발 관련 전문 지식이 없이도 AI의 적용 가능성을 탐색하고 나아가 실제 서비스에 적용해볼 수 있다습니다. 과학기술정보통신부는 지난 16일에 하이퍼클로바를 통해 국내 공공·연구기관과 대학·중소기업들의 연구 및 서비스 개발에 활용할 수 있도록 지원하는 사업을 시작한다고 밝히기도 했습니다."

-네이버가 공을 들여 개발한 하이퍼클로바를 외부에 사실상 무료로 풀어버리는 건데 쉽지 않았을 결정 같다.

"초거대 AI 모델의 활용성은 많은 시도를 해야 확장된다고 판단합니다. 스튜디오를 연 거는 사실 초거대 AI로 뭐가 나올지 저희도 몰라서 연 거예요. 저희 혼자만 개발하면 한계가 있습니다. 어차피 혼자서 하이퍼클로바 전체를 활용 못합니다. 저희 플랫폼 위에서 많은 사람들이 오면 많은 가능성을 빠르게 확인할 수 있습니다. 내가 못 먹을 거 너도 먹지 말라는 식이 아니잖아요. 진짜 이런 의도로 시작한 거예요. 그래서 그런 기회가 여러분 눈앞에 있으니 이걸 좀 많이 활용해서 찾아보자. 그러면 한국에 좋은 일이 되지 않을까. 일단 AI 생태계가 키우는 것이 저희 전략입니다."

▲성낙호 네이버 클로바 CIC 책임리더

-클로바 스튜디오의 궁극의 목표는 무엇인가

"클로바 스튜디오 실험이 성공한다면 AI 엔지니어 없이 AI를 만드는 걸 관찰할 수 있을 것입니다. 모든 사람이 부담 없이 AI를 쓸 수 있는 시대를 여는 그림을 그리고 있다고 보면 됩니다."

"AI라는 서비스를 활용하는 게 자연스러운 것이라면 플랫폼이 등장할 것입니다. AI 시대에는 네이버가 AI 플랫폼으로서의 역할을 하겠다는 비전이 있습니다. 국내외 빅테크들 다 이런 식으로 비즈니스 모델을 잡고 있는 것으로 알고 있습니다. AI 플랫폼의 수익화의 핵심은 AI 플랫폼에 얼마나 고부가가치 서비스를 얹히느냐일텐데, 결국 파이를 키워서 수익화를 이뤄나가자는 것이지 AI 수수료 장사를 하자는 게 아녜요."

-올해 네이버 글로벌 진출 본격화를 선언했다. 네이버의 AI가 글로벌에서 성공할 수 있다고 보나

"글로벌화(globalization)란 키워드가 과거와 지금의 의미가 다른 것 같습니다. 기존 글로벌은 하나의 기준을 세계에 퍼뜨리는 '인터내셔널라이제이션'(Internationalization)이었다면 지금은 '로컬라이제이션'(Localization) 즉 현지화가 핵심이다. 최근 데이터도 주권이랑 연결돼 현지 클라우드만 쓰게끔 추세가 바뀌고 있습니다. 네이버는 라인 등을 통해 각 권역의 문화와 특성에 맞게 진출하고 있는 전략을 취하고 있습니다.

-오랫동안 예견된 범용 인공지능(AGI: Artificial general intelligence: 인간이 할 수 있는 어떠한 지적인 업무도 성공적으로 해낼 수 있는 기계의 지능) 등장, 즉 AI가 인간을 초월하는 특이점(Singularity) 도달 시점에 대해 다양한 관측이 나온다. 어떻게 생각하나.

"AGI는 사람들이 원래 만들어놓은 개념이잖아요. 모든 일을 할 수 있는, 그게 뭔지는 모르겠네요. 저희가 만든 AI라는 게 사람들이 생각하는 AI랑 달라요. 영화 속에 나오는 슈퍼 파워 같은 AI를 사람들이 생각하는데 저희가 만든 건 언어 모델이에요. AI는 도구로서 존재하지 인간을 초월하지는 않죠. 만약 AI가 사람을 뛰어넘는 시점이 온다면 사람이 만들고 있는 AI가 그 과정조차 AI가 하게 됐을 때가 아닐까요."

"최근 구글의 초거대 AI '람다'에 의식이 있다는 주장이 제기됐는데 AI는 사람이 한 지적 행동이라면 다 학습하기 때문에 사람의 행동을 모사할 수 있죠. 그런데 그렇다고 그게 의식을 갖고 있다고 얘기할 수 있는 것은 전혀 아닙니다. 현재의 AI는 도구일 뿐입니다.."

-국내 AI 산업을 위한 정책적 제언이 있다면.

"AI는 기존 법령과 제도로 봤을 때는 판단을 못하는 영역이 많아요. 미국의 경우 일단은 플레이를 하도록 하고 나중에 문제가 있으면 조금씩 고쳐가는 형태인데 우리나라는 보통 판단 못하면 대부분 다 보수적으로 잡아서 못 하게 하는 쪽으로 가거든요. 한 번도 기술 선도를 해본 적이 없어서 그런지 모르겠는데 선진국쪽 판례를 기다려요. 네이버는 프러덕트, 즉 AI 상용화 레벨로 세계에서 선두로 치고 나가는 그룹인데 선진국에도 판례가 없으면 꼬이게 되죠. 세계적으로 기술 경쟁이 치열한데 이런 법제도 환경에서는 기술 개발을 하는데 한계를 느끼죠. 재작년에 소수자 차별·혐오 발언과 개인정보 유용 등의 문제로 '이루다 사태'가 사회적 이슈가 됐는데 문제가 생길 때마다 보수적으로 접근하면 기술개발 동력이 많이 떨어집니다."

-AI 개발자를 꿈꾸는 이들에게 조언을 한다면?

"데이터가 지능화되고 있습니다. 이게 주요 트렌드입니다. 머신러닝 기술이 알아서 데이터를 지능화하고 개선하고 있다는 의미죠. 그런 맥락에서 연구자들이 남이 정립한 문제에 약간의 개선책 위주로 연구하는 경우가 많은데 단순히 AI를 조금 개선하는 데 공을 들이기보다 문제를 정의하고 새로운 연구 방향을 뚫는 것에 주안점을 뒀으면 좋겠습니다.

성낙호 리더 약력

▲1997년 서울과학고 졸업 ▲2008년 서울대 컴퓨터공학 학사 졸업 ▲1999-2004년 (주)헥스플렉스 창업 (기술고문) ▲2004-2014년 레드덕 디렉터 ▲2014-2017년 엔씨소프트 A2 AI 테크 부장 ▲2017-2019년 네이버 클로바 리더 ▲2019-현재 네이버 클로바 CIC 책임리더

◎공감언론 뉴시스 [email protected]