VOL.2026.06.21·19 STORIES·AITOP DAILY

AITOP日报

二〇二六年六月二十一日 星期日DAILY · 每早八时
01

模型发布/更新

Model Releases
3
02

产品发布/更新

Product
3
03

行业动态

Industry
3

Gary Marcus 反驳 Jack Clark:Claude Code 并非仅靠规模

X·KOLX:Gary Marcus (@GaryMarcus)原文 ↗

Anthropic 联合创始人 Jack Clark 表示 AI 进步仅靠规模扩展就能实现,但 Gary Marcus 引用该公司自己的 Claude Code 予以反驳,指出该工具使用了 50 万行符号代码、harnesses、符号工具和正则表达式。Marcus 认为专门化系统并非无用,规模扩展也非唯一路径。该争论涉及“bitter lesson”假说与实用工程系统的平衡。

开放权重模型正缩小与前沿模型的差距

X·KOLX:ollama (@ollama)原文 ↗

Ollama 转发了 Aaron Levie 的观点,指出开放权重模型在特定任务上已取得 SOTA 结果,并在编码等部分领域接近前沿水平。Levie 强调,开放权重模型与前沿模型之间的边际差距若能保持而非扩大,将创造更多 AI 应用价值。他还提到,使用更便宜或针对特定任务微调的开放模型可优化成本,同时前沿模型仍可用于规划、编排等复杂工作。

04

论文研究

Research
3

OpenAI 新论文:用RL训练好行为也能泛化,提升模型诚实与可纠正性

X·KOLX:orange.ai (@oran_ge)原文 ↗

OpenAI 发布新论文《Beneficial RL》,研究对齐训练中好行为的泛化能力。实验发现,用RL在对话数据上训练模型诚实、认知谦逊、可纠正等特质后,在44个训练未见的评测上,模型欺骗、谄媚、有害建议等行为均下降。仅用健康领域数据训练,非健康领域也有效。对抗性提示和恶意微调更难使模型变坏,但正常指令仍可执行。

台积电加速研发CoPoS封装取代CoWoS,玻璃核心基板降本30%

官方IT之家原文 ↗

台积电正全力研发面板级封装技术CoPoS,计划替代现有CoWoS工艺。CoPoS采用方形面板基材(最大750×620毫米),对比CoWoS圆形300毫米晶圆,材料利用率从不足70%提升至90%以上。单位面积生产成本可降低20%至30%。台积电已建成首条试验产线,CoPoS面板将于2027年试生产,2028年规模化量产,集成玻璃核心基板的完整工艺量产定在2030年后。英特尔、AMD等厂商也在推进类似方案。

Jerry Liu提出智能体原生文档格式:需类似Google Docs的协作界面

X·KOLX:Jerry Liu (@jerryjliu0)原文 ↗

LlamaIndex创始人Jerry Liu指出,智能体生成文档量增加,需要更好的原生文档格式。当前主要容器Markdown可读性强但缺乏丰富视觉输出,HTML视觉丰富但难以人工编辑且token密集。他提出理想格式应类似Google Docs或Word,支持人类和智能体协作编辑、版本控制和权限管理。他在Databricks演讲中提及,大量人类知识仍存储在PDF、PPT、Word中,需通过LlamaParse处理,同时创新智能体创建和协作信息的方式。

05

技巧与观点

Tips & Takes
3

如何让 AI Agent 生成的代码更可靠:软件工程经验迁移

X·KOLX:宝玉 (@dotey)原文 ↗

文章将传统软件工程实践迁移到 AI Agent 开发中,强调需求分析时需给 Agent 充足上下文并反复对齐,系统设计时用 plan 模式拆分里程碑。代码审查建议先让 Agent 审查格式和逻辑,但人需兜底业务逻辑。自动化测试包括单元测试、集成测试和端到端测试,需与 CI 集成自动运行。灰度发布和 CI/CD 机制(如 feature flag、自动回滚)可减少线上不稳定。线上修复目前更现实的是 AI 辅助定位、人确认后再提交,而非全自动闭环。

19
今日事件
4
一手报道
4
新模型
16
信源
AITOP · 编辑系统自动生成