美 오픈AI, 中 딥시크의 데이터 무단 유출 의혹 조사
딥시크의 R1에 물으면 오픈AI에서 가져온 정황 포착
트럼프 ‘AI 짜르’ 삭스도 “상당한 증거가 있다” 공격
딥시크“‘증류’기술 활용했지만 자체 모델 기반” 주장
![[베이징=AP/뉴시스] 28일 중국 수도 베이징의 한 사용자 휴대전화 화면에 딥시크(DeepSeek)와 챗GPT(ChatGPT)의 애플리케이션이 보이고 있다. 2025.01.30](https://img1.newsis.com/2025/01/28/NISI20250128_0000066002_web.jpg?rnd=20250128201016)
[베이징=AP/뉴시스] 28일 중국 수도 베이징의 한 사용자 휴대전화 화면에 딥시크(DeepSeek)와 챗GPT(ChatGPT)의 애플리케이션이 보이고 있다. 2025.01.30
[서울=뉴시스] 구자룡 기자 = 미국의 생성형 인공지능 챗GPT를 운영하는 오픈AI는 중국 인공지능 스타트업 딥시크가 미국 회사의 AI 모델에 반복적으로 쿼리를 보내어 새로운 챗봇을 훈련시켰는지 조사하고 있다고 월스트리트저널(WSJ)이 29일 보도했다.
이 회사 대변인은 딥시크가 오픈AI의 도구에서 대량의 데이터를 추출해 기술 개발을 도왔다는 징후를 검토 중이라고 밝혔다. 이 과정은 ‘증류(distillation)’라는 과정을 통해 이루어졌다.
오픈AI의 서비스 약관에는 고객이 해당 AI 모델의 출력을 사용하여 자체 경쟁력 있는 모델을 개발하는 것을 금지한다.
오픈AI 대변인은 “우리는 기술을 보호하기 위해 적극적이고 사전 예방적 대책을 취하고 있으며 미국 정부와 긴밀히 협력할 것”이라고 말했다.
오픈AI는 이전에 자사 모델을 유출한 것으로 의심되는 계정을 금지했다. 주요 파트너인 마이크로소프트와 협력해 이러한 시도의 배후에 있는 행위자를 파악했다고 밝혔다.
오픈AI의 의혹 제기는 저렴한 비용으로 비슷한 능력을 발휘한다며 돌풍을 일으킨 딥시크 모델의 성능이 원래 보였던 것보다 덜 인상적일 수 있다는 전망을 제기한다고 WSJ은 전했다.
또한 최첨단 모델을 훈련하는 데 수억 달러를 지출하는 회사가 경쟁자가 작업을 모방하는 것을 막는 데 어려움을 겪을 수 있다는 점도 다시 제기됐다.
일부 딥시크 사용자는 챗봇이 때때로 오픈AI에서 가져온 것처럼 보이는 텍스트로 응답하는 것을 알아챘다.
미디어 사이트 레딧의 한 사용자가 게시한 스크린샷에 따르면 챗봇은 “이제 오픈AI의 정책에 따라 의식이나 지각력이 있다고 주장하는 것을 피해야 한다”고 응답했다.
딥시크는 27일 증권 시장에서 큰 파장을 일으켰다.
투자자들이 딥시크의 새로운 R1 모델이 덜 정교한 칩으로 학습되었음에도 불구하고 좋은 성능을 보인다는 소식을 받아들이면서 원래는 어렵거나 불가능하다고 여겨졌던 작업을 수행하는 것이 가능해졌다고 봤기 때문이다.
‘증류’는 더 크고 비싼 모델의 응답 데이터베이스에서 학습하여 더 작고 효율적인 AI 모델을 개발하는 데 사용된다.
이는 효과적으로 큰 모델의 전문성을 더 작은 모델로 축소하는 동시에 더 큰 모델의 추론을 모방할 수 있도록 한다.
도널드 트럼프 대통령의 ‘AI 짜르’로 임명된 데이비드 삭스는 28일 딥시크가 오픈AI 모델을 추출하여 자체 모델을 구축했다고 명시적으로 비난했다.
실리콘 밸리의 베테랑 벤처 캐피털리스트이기도 한 삭스는 “딥시크가 한 일은 오픈AI의 모델에서 지식을 추출한 것이라는 상당한 증거가 있다”고 말했다.
딥시크측은 ‘증류’ 기술을 사용했지만 자체 모델에 기반한 것이라고 주장하고 있다.
십시크의 최근 연구 논문에서 ‘증류’를 사용하여 가장 강력한 모델인 R1에서 가져온 결과물로 유사한 추론 능력을 보이는 더 작은 모델들을 훈련시켰다는 것이다.
WSJ은 자사의 소유기업인 ‘뉴스 코퍼레이션’이 오픈AI와 컨텐츠 라이센싱 계약 관계에 있다고 덧붙였다.
◎공감언론 뉴시스 kjdragon@newsis.com