俄语宣传骗过AI模型有多容易？新基准测试揭示

精选理由

想知道你用的AI会不会被俄语宣传带跑偏？爱沙尼亚语言研究所测了8个主流模型，GPT-4o最扛打，Llama 3.1中招率最高。看看你的AI排第几。

AI 摘要

爱沙尼亚语言研究所发布了一项基准测试，用于评估AI语言模型对俄语宣传的抵抗力。测试涵盖了GPT-4o、Claude 3.5 Sonnet、Llama 3.1等8个模型，发现部分模型在30%的测试样本中会生成亲俄内容。Meta的Llama 3.1 70B表现最差，错误生成率高达42%；而OpenAI的GPT-4o错误率最低，仅为12%。该基准测试还包含一个包含1000个样本的俄语宣传语料库，用于衡量模型对政治操纵的脆弱性。

AI 翻译 · 中文

DecoderThe Institute of the Estonian Language has released a benchmark measuring how susceptible AI language models are to Russian propaganda. The article How easily can Russian propaganda fool AI models? A new benchmark finds …

Jim Fan06-16 21:51原文
OpenAI Blog06-17 00:00原文
shao__meng06-14 12:38原文
@koltregaskes06-16 19:35原文
宝玉06-16 23:30原文
marktechpost06-17 05:49原文
AI Will06-17 09:19原文
Aadit Sheth06-17 19:22原文
lmarena.ai06-17 20:21原文
berryxia06-18 03:41原文

阅读原文