AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:事实核查×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月29日
10:12
10:12SuperTechFans(博客/媒体)
Hacker News 热议 AI 提升白领生产力可能带来四天工作制,但评论指出收益多被资本攫取,员工面临裁员风险而非休假。YouTube 宣布从 2026 年 5 月起自动为逼真 AI 视频打标,但用户担忧低质高刺激内容让儿童与老人沉迷。Anthropic 发布 Claude Opus 4.8,小幅改进编码与推理,但社区更看好小模型强化方法。前沿 LLM 在事实核查上分歧显著,缺乏“我不知道”选项削弱可信度。FBI 拘捕藏有约四千万美元金条的 CIA 高官,舆论聚焦低级失误。
行业AI 生产力四天工作制AI 标签Claude Opus 4.8事实核查

推荐理由:AI 生产力提升的分配问题直接关系到每个白领的未来,做技术或管理的读者看完会反思自己的处境;YouTube 的 AI 标签政策影响内容生态,创作者和用户都该了解。
原文
5月25日
15:37
15:37Decoder@Jonathan Kemper
精选
北京大学研究人员发现,GPT、Gemini等主流AI模型在文档分析中经常给出正确答案,但引用的文本段落并不支持其结论。这种现象被称为“归因幻觉”,在法律、医学等需要严格引用来源的领域存在风险。为系统检测这一问题,团队推出了首个专门基准测试CiteVQA。该研究揭示了AI在推理与引用之间的不一致性,对依赖AI进行事实核查的用户具有警示意义。
论文归因幻觉CiteVQAGPTGemini事实核查

推荐理由:做文档分析或事实核查的开发者要注意了——AI可能答对了但引用了错误来源,北大这个新基准能帮你识别这类风险,建议点开了解如何防范。
原文
5月13日
21:36
21:36Simon Willison’s Weblog(博客/媒体)
纽约时报发布编辑注,承认一篇报道中错误地将 AI 生成的摘要当作加拿大保守党领袖 Pierre Poilievre 的真实引文。该 AI 工具生成了对 Poilievre 政治观点的总结,并以引号形式呈现,记者未核实其准确性。文章现已更正,引用了 Poilievre 在 4 月演讲中的真实内容。此事件凸显了 AI 在新闻业中可能引发的幻觉和事实核查风险。
行业AI 伦理幻觉新闻业事实核查纽约时报

推荐理由:新闻编辑室和内容创作者必须警惕 AI 工具生成虚假引文的风险——纽约时报的这次失误是活生生的教训,做事实核查的团队建议仔细看。
原文
精选全部日报登录