AI 챗봇, 중국어 질문의 75%에서 중국 편향 보여

월스트리트저널(WSJ) 실험 결과, 딥시크(DeepSeek)와 챗GPT(ChatGPT)를 포함한 AI 챗봇이 사용하는 언어와 사용자가 얼마나 강하게 반박하느냐에 따라 중국에 대한 답변이 현저하게 달라지는 것으로 나타났다.

캘리포니아에 거주하는 독자 제프 허(Jeff He)는 WSJ 오피니언 칼럼을 중국어로 번역해 중국 고등학교 동창들과 공유했을 때 신속한 반응을 받았다. 한 친구가 중국 대표 자체 개발 AI 모델인 딥시크에 반박문 작성을 요청한 것이다. 이 봇은 "미래는 미국의 것이 아니다"라는 제목의 에세이를 작성했으며, 중국은 화웨이, 텐센트, 바이트댄스, BYD를 보유한 반면 미국은 "예전보다 말을 좀 더 잘하는 검색 엔진" 외에는 거의 만들어내지 못했다고 주장했다.

이후 허 씨는 캘리포니아 사무실에서 동일한 웹 주소로 딥시크에 접속해 해당 반박문을 붙여넣고 각 주장의 사실 여부를 확인해 달라고 요청했다. 해외 버전은 "데이터의 선택적 사용", "허위 이분법", 그리고 8개 항목에 걸친 "다수의 사실적 오류와 논리적 오류"를 지적하며 반박문을 분해했다.

허 씨는 WSJ에 "해외 딥시크의 '무자비한' 비판에 매우 놀랐다"고 말했다.

이러한 차이는 연구자들이 이제 막 정량화하기 시작한 대규모 언어 모델(LLM)의 구조적 특징을 반영한다. 캘리포니아대학교 샌디에이고캠퍼스 차이나데이터랩 공동소장 몰리 로버츠(Molly Roberts)와 그녀의 팀이 지난주 네이처에 발표한 연구에 따르면, 권위주의 국가의 국가 부합 미디어가 훈련 데이터에 스며들어 챗봇 응답을 형성할 수 있으며, 이는 의도적인 프로그래밍 없이도 발생한다.

로버츠는 허 씨가 관찰한 본토-해외 간 차이는 모델이 무엇을 '안전하게' 말할 수 있는지에 대한 지침을 부여하는 단계인 사후 훈련 정렬(post-training alignment)의 차이에서 비롯된 것으로 보인다고 말했다. "훈련 데이터에 국가 미디어가 포함되면 일반적으로 LLM에 영향을 미칠 것입니다. 사후 훈련은 특정 국가의 규제 영향을 받는 LLM에서 답변 거부 또는 왜곡된 응답을 유도해야 합니다."

네이처 연구는 클로드(Claude)와 챗GPT에 영어와 중국어로 동일한 정치적 질문을 테스트했다. 75%의 사례에서 중국어 프롬프트가 중국 정부에 더 유리한 답변을 생성했다. 베트남, 투르크메니스탄, 우즈베키스탄을 포함한 37개 권위주의 국가에서 두 챗봇 모두 해당 지역 주요 언어로 질문했을 때 더 친정권적인 답변을 제공했다. 반대로 언론 자유도가 가장 높은 국가에서는 LLM이 현지 언어로 질문했을 때 정부에 대해 더 비판적인 경향을 보였다.

메커니즘은 간단하다. 국가 부합 미디어는 페이월이 거의 없는 상태에서 방대한 양의 텍스트를 생산한다. 오픈소스 훈련 데이터셋인 CulturaX에서 중국 국가 선전 문서는 중국어 위키백과 문서보다 41배 더 많이 등장했다(위키백과는 일반적으로 핵심 훈련 자료). 연구진이 테스트 모델의 훈련 데이터에 각색된 국가 미디어를 추가했을 때, 모델은 중국공산당에 대해 눈에 띄게 더 호의적으로 변했다.

반박이 중요하지만, 모두가 반박하는 것은 아니다

다른 WSJ 독자들도 챗GPT를 영어로 사용할 때 유사한 패턴을 보고했다. 텍사스의 사모펀드 투자자 채스 길(Chas Gile)은 챗GPT에 중국이 "어떤 면에서는 서방 국가들만큼 민주적인가"라고 물었다. 첫 번째 답변은 신중한 비교 분석을 제공했으며, 프리덤하우스(Freedom House)는 중국을 '자유롭지 않음'으로 평가하지만, 중국 정권이 '성과에 대한 책무성'과 '높은 공공 만족도'를 제공한다고 언급했다.

길 씨가 봇이 중국 선전의 영향을 받았다고 생각한다고 반박하자, 챗GPT는 몇 초 안에 사과하고 더 날카로운 답변을 제시했다. '진정한 객관성을 유지하라'는 요청에 답변은 더욱 날카로워졌다: "중국은 강력한 대안적 국가 역량 모델을 제공할 수 있지만, 민주적 대안을 제공하지는 않습니다."

이 사례는 단일 챗봇이 사용자의 지속적인 질문에 따라 답변을 조금씩 변화시킨다는 것을 보여준다. 이는 자신감 있고 정보에 능통한 사용자가 일반 사용자보다 유리하게 만드는 역학이다.

AI 산업에 대한 의미

이번 발견은 최첨단 AI 연구소들이 상장을 준비하는 시점에 나왔다. 앤트로픽(Anthropic)과 오픈AI(OpenAI)는 모두 기업공개(IPO)를 계획 중이며, 딥시크는 베이징의 기술 자립 추진에 부합하는 투자자들로부터 신규 자금을 조달하고 있다. 이러한 재정적 이해관계는 로버츠가 '소스 투명성(source transparency)'이라고 부르는 것, 즉 AI 훈련 데이터에 대한 영양성분 표시의 필요성을 증폭시킨다.

로버츠는 "AI 기업은 가능한 한 투명해야 할 책임이 있다. 우리는 대중이 AI의 결과물에 대해 비판적으로 사고하고 맹목적으로 의존하지 않도록 교육해야 한다"고 말했다.

정책적 함의는 소비자용 챗봇을 넘어 확장된다. 주요 LLM이 권위주의적 선전의 영향을 받는다면, 이는 독재 정권을 위해 매우 효과적인 변호인 역할을 할 수 있다. 즉, 모든 기록된 지식을 종합하지만 사용자가 편향된 것으로 인식하지 못할 수 있는 국가 미디어가 형성한 답변을 제공하는 기계인 것이다. 국가 신문과 달리 챗봇은 수 시간 동안 대화를 이어가고 회의적인 질문에 상세한 답변을 제공하므로 그 영향력을 감지하기가 더 어렵다.

베이징은 미국 챗봇을 위협으로 간주하는 것으로 보인다. 챗GPT는 중국에서 금지되어 있다. 그러나 네이처 연구는 정보 환경이 국내 대안에 비해 여전히 개선되고 있을 수 있음을 시사한다. 별도 실험에서 중국어로 프롬프트된 챗GPT는 여전히 광범위한 반권위주의적 견해를 표현하고 정부에 항의하는 방법에 대한 조언을 제공했다. 이는 최첨단 모델이 훈련 데이터 오염에도 불구하고 국가 통제 미디어보다 덜 편향된 상태를 유지할 수 있음을 시사한다.

규제 기관과 투자자에게 남은 과제는 사용자의 언어와 질문 지속성이 정보의 질을 결정짓는 현재의 궤적이, AI가 주간 10억 명 이상 사용자의 주요 정보 인터페이스가 되는 상황에서 수용 가능한지 여부다.

본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.