全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

16:14

16:14

shao__meng@shao__meng

精选

场外衍生品市场名义价值 846 万亿美元，45% 的保证金追缴存在争议，其中过半源于双方对同一份 CSA 合同的理解不同。该系统将流程拆为四层：ADE 按专用 Schema 提取字段并绑定源页码；三个 Claude Agent 并行归一化抵押品描述、时区和货币条款，纯规则验证 Agent 预审矛盾项；五步骤纯 Python 计算器执行确定性运算，零 LLM 调用；最终生成带追溯、推理链和可独立运行脚本的审计包。核心洞察是争议根源在合同解读而非数学，LLM 负责模糊语义判断，规则负责一致性算术，两者接口显式化。该分离原则适用于保险理赔、监管报告等一切文档解释驱动确定性计算的高风险场景。

AI产品智能体金融科技 LLM应用可审计性架构设计

推荐理由：金融衍生品团队终于有了解决保证金争议的架构方案——把 LLM 的模糊判断和规则的确定性计算分离，做 OTC 清算、合规或风控的开发者可以直接参考这套可审计设计。

5月29日

05:36

05:36

rohanpaul_ai@rohanpaul_ai

WallStreetPrep 进行了一项针对真实金融场景的 AI 基准测试，任务要求 AI 构建苹果公司历史和预测财务报表，包括引用来源、链接假设、添加附表并确保工作簿可审计。Primer 作为 AI 金融建模工具胜出，其优势在于将 Excel 视为最终输出格式而非工作语言，先构建强健的三表模型再转换为可审计的电子表格。Primer 将工作簿表示为结构化记录（如收入、成本、现金、债务、假设、公式、来源链接、注释和依赖检查），使 AI 能直接查询和验证财务逻辑，例如“显示所有影响现金流的公式”或“查找资产负债表平衡项”，而非逐格编辑脆弱的单元格引用。这反映了专业 AI 代理的评判标准正从聊天质量转向产出物能否通过审计。

AI产品金融 AI Primer Excel 建模可审计性 AI 代理

推荐理由：金融从业者终于有了可审计的 AI 建模方案——Primer 解决了 Excel 模型难以验证的痛点，做财务分析或审计的团队值得关注这个方向。

5月18日

12:01

12:01

arXiv cs.AI@Xavier Theimer-Lienhard, Mushtaha El-Amin, Fay Elhassan, Sahaj Vaidya, Victor Cartier-Negadi, David Sasu, Lars Klein, Mary-Anne Hartley

精选

Fully Open Meditron 是首个完全开放的临床大语言模型（LLM）构建管道，解决了现有“开放”模型仅开放权重、缺乏数据来源和训练流程透明性的问题。该管道包含经临床医生审核的训练语料库、可复现的数据构建和训练框架，以及对齐临床使用的评估协议。语料库整合了8个公开医学QA数据集，并扩展了三种临床医生验证的合成数据：考试式QA、基于46,469条临床实践指南的QA和临床小案例。评估采用LLM作为裁判的协议，校准了204名人类评分员。在五个全开放基座模型上应用后，所有MeditronFO变体均优于基座，其中Apertus-70B-MeditronFO在医学综合基准上提升6.6个百分点，达到53.8%，创下全开放模型的新纪录。结果表明，全开放管道可以在不牺牲可审计性和可复现性的前提下实现领域内最先进性能。

论文临床LLM 全开放管道可审计性医学QA 开源/仓库

推荐理由：做临床AI或医疗NLP的团队终于有了一个可审计、可复现的完整管道，不用再猜数据来源和训练细节——直接拿来用或参考构建自己的CDSS，值得点开看具体实现。