AITOP6月11日 15:28
精选
过去 24 小时,从 836 条中筛出 51 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
10:55
10:55
arXiv cs.AI@Krti Tallam
精选
推荐理由:生产级AI智能体面临的安全治理空白终于有了系统化的架构方案——做AI Agent部署、企业安全架构的团队可以直接参考这个五平面模型来设计自己的治理层,建议点开看看具体的中断原语和正确性证明。
6月9日
05:46
05:46
rohanpaul_ai@rohanpaul_ai
精选
推荐理由:这项研究揭示了AI在科学数据检索中的致命短板,做生物信息学或依赖AI处理数据库的团队值得关注——重复检索工具可能是提升可靠性的关键。
6月8日
10:42
10:42
Tw93@HiTw93
精选
推荐理由:Waza 把工程团队的日常习惯变成了 AI 智能体可以直接执行的技能,做自动化流程的开发者值得一试,能减少重复劳动。
6月1日
00:09
AITOP6月1日 00:09
5月29日
12:40
12:40
LlamaIndex@llama_index
精选
推荐理由:做文档解析或构建 AI 智能体的开发者,可以看看 ParseBench 的详细数据,评估是否值得升级。
5月28日
11:36
11:36
arXiv: OpenAI@Ian Diks, Harihara Muralidharan, Tim Proctor, Kenny Workman
精选
推荐理由:空间生物学研究者终于有了衡量AI科学推理能力的硬核基准——SpatialBench-Long 要求智能体从复杂空间数据中推导真实结论,而非简单跑流程。做生物信息学或AI for Science的团队,值得看看当前模型的表现差距在哪里。
5月27日
10:29
10:29
arXiv cs.AI@Tamerlan Aghayev, Maxime Elkael, Michele Polese, Minh Dat Nguyen, Gabriele Gemmi, Andrea Lacava, Ali Saeizadeh, Reshma Prasad, Paolo Testolina, Angelo Feraudo, Soumendra Nanda, Pedram Johari, Salvatore D'Oro, Tommaso Melodia
精选72°
推荐理由:GENESIS解决了6G RAN研发中手动迭代耗时的核心痛点,做通信系统开发或6G标准研究的团队可以直接用这个框架加速从规范到验证的全流程。
5月22日
08:05
08:05
Firecrawl@firecrawl_dev
精选
推荐理由:做 AI 智能体或 RAG 应用的开发者,网页数据获取一直是痛点——Firecrawl 直接解决了这个问题,值得一试。
5月19日
14:33
14:33
arXiv cs.AI@Sanderson Oliveira de Macedo, Ronaldo Martins da Costa
精选72°
推荐理由:做遗留系统现代化或AI驱动代码迁移的团队,终于有了一个能自动生成可追溯规范的框架——Reversa 直接帮你把老代码变成AI智能体能理解的文档,建议做COBOL迁移或大型系统重构的开发者点开看看。
5月15日
09:57
09:57
arXiv cs.AI@Licong Xu, Thomas Borrett
精选
推荐理由:宇宙学研究者终于有了能自主推进发现的AI工具——CMBEvolve和CosmoEvolve分别解决了定量优化和开放式探索两大痛点,做数据分析或理论建模的团队可以直接参考其方法。
5月13日
19:12
19:12
arXiv: OpenAI@Zhun Wang, Nico Schiller, Hongwei Li, Srijiith Sesha Narayana, Milad Nasr, Nicholas Carlini, Xiangyu Qi, Eric Wallace, Elie Bursztein, Luca Invernizzi, Kurt Thomas, Yan Shoshitaishvili, Wenbo Guo, Jingxuan He, Thorsten Holz, Dawn Song
精选75°
推荐理由:安全研究员和红队成员终于有了评估 AI 攻击能力的标准化工具——ExploitGym 覆盖真实漏洞和防御场景,做渗透测试或 AI 安全评估的团队可以直接拿来用。
