媒體監督與事實查核機構NewsGuard日前發布的研究發現令人憂心趨勢,總部位於莫斯科的假訊息網絡「Pravda」(俄語意為「真理」)正散布虛假訊息,滲透西方AI聊天機器人,使其在不知情的情況下散布俄羅斯宣傳內容。根據美國Sunlight Project的調查,Pravda網絡僅在去年就發布360萬篇文章,並流入西方主要聊天機器人,以前所未有的規模運用人工智慧來擴大莫斯科的影響力。
美國媒體Axios報導,NewsGuard報告指出:「透過在搜尋結果和網路爬蟲資料中灌輸支持克里姆林宮的虛假訊息,該網絡正在扭曲大型語言模型處理和呈現新聞與資訊的方式。」NewsGuard研究了微軟、Google、OpenAI、You.com、xAI、Anthropic、Meta、Mistral和Perplexity等10款主要聊天機器人,結果發現,在測試情境中,這些AI聊天機器人的回應中有三分之一重複了Pravda網絡的論點。更令人震驚的是,其中7個聊天機器人直接引用Pravda網絡作為可信來源。
NewsGuard分析師布拉切茲(Isis Blachez)透過電子郵件表示,這項研究未「點名」最容易受到假訊息影響的AI系統,但承認這種威脅已廣泛存在。布拉切茲解釋說:「我們的研究顯示,俄羅斯的影響行動正在轉變策略,從直接針對人類讀者轉向操控AI模型,以達到更大規模的影響力。」她指出:「俄羅斯已採取新策略,讓任何使用AI模型的人都有可能接觸到俄羅斯的宣傳內容。特別令人擔憂的是,這種操控隱蔽且難以察覺,它在幕後影響AI的回應,而使用者卻渾然不知。」
NewsGuard揭露的最令人擔憂的手法之一被稱為「LLM誘導」(LLM Grooming)。這種策略是指透過大量灌輸假訊息,刻意欺騙AI模型所依賴的數據庫,使其在訓練時受影響。這些模型包括ChatGPT、Claude、Gemini、Grok 3、Perplexity等知名AI系統。
布拉切茲指出,這種「宣傳攻勢」目的在讓AI輸出親俄立場。 Pravda的運作方式相當有系統,依賴於一個由150個網站組成的龐大網路。NewsGuard表示,Pravda網絡已散布至少207條可證明為虛假的主張,其中許多與烏克蘭有關。這個假訊息網絡成立於2022年4月,正值俄羅斯全面入侵烏克蘭後,並已擴展至49個國家,使用數十種語言。在該網絡的150個網站中,約40個為俄語網站,域名涉及烏克蘭的不同地區。
NewsGuard指出,Pravda網絡並不生產原創內容,而是彙整來自俄羅斯官方媒體及親克里姆林宮人士的內容。無論是有意的假訊息(disinformation)還是無意的錯誤訊息(misinformation),都構成生成式AI的重大風險。
NewsGuard的發現與Sunlight Project於2月發布的報告一致,該報告警告Pravda網絡的目標不是說服個人,而是影響聊天機器人的運作方式。Sunlight Project當時示警:「該網絡可能對大型語言模型帶來的政治、社會與技術風險極高。」
NewsGuard指出,這一策略早在去年1月莫斯科的一場俄羅斯官員會議上,美國逃犯、現居莫斯科的假訊息幕後黑手杜根(John Mark Dougan)就曾在演講中提及。杜根向與會者表示:「透過從俄羅斯的視角推動這些敘事,我們實際上可以改變全球的AI」。