AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 858 条中筛出 47 条
全部模型产品行业论文技巧
标签:Meta×
6月12日
11:52
11:52Epoch AI@EpochAIResearch
精选
Epoch AI Research 发布数据显示,单个数据中心的计算能力纪录每7个月翻一番。Colossus 1、Anthropic-Amazon New Carlisle 和 Meta Prometheus 先后成为算力最强的数据中心。这一趋势反映了AI算力需求的急剧增长,以及科技巨头在基础设施上的激烈竞争。对于AI模型训练和部署而言,算力密度的快速提升意味着更高效的训练和更复杂的模型成为可能。
行业算力数据中心ColossusAnthropicMeta

推荐理由:算力密度翻倍周期缩短到7个月,做AI基础设施或大模型训练的团队需要关注这个节奏,它直接决定了你的训练成本和模型规模天花板。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月23日
23:09
23:09rohanpaul_ai@rohanpaul_ai
精选76°
Meta 最新论文发现,编码智能体在复用过去尝试的简短摘要(而非原始日志)时,性能显著提升。研究表明,更强的编码智能体不仅需要更多尝试,更需要更好的记忆方式。论文提出将每次完整尝试转化为紧凑摘要,包含主要猜测、部分进展和失败点,然后利用这些摘要选择最佳尝试并指导新尝试。在 SWE-Bench Verified 基准上,Claude 4.5 Opus 从 70.9% 提升至 77.6%,在 Terminal-Bench v2.0 上从 46.9% 提升至 59.1%。核心结论是:长编码任务的测试时扩展瓶颈不在于生成更多尝试,而在于以智能体可复用的形式存储经验。
论文Meta编码智能体测试时扩展摘要复用SWE-Bench

推荐理由:这篇论文戳中了编码智能体效率低下的核心痛点——不是试得不够多,而是记不住经验。做 AI 编程工具或智能体开发的团队,可以直接借鉴其摘要复用和锦标赛选择方法,值得点开看看。
原文
5月19日
08:37
08:37elvis@omarsar0
精选76°
Meta 提出 AIRA 智能体系统,通过两个分工明确的智能体(AIRA-Compose 负责宏观架构搜索,AIRA-Design 负责底层机制实现),在 24 小时计算预算内自主发现了超越 Llama 3.2 的神经网络架构(350M、1B、3B 规模)。该方法将策略制定与实现分离,相比单端到端智能体在真实搜索任务上表现更优。论文已公开,对架构搜索和智能体设计有重要参考价值。
论文MetaAIRA神经网络架构搜索智能体Llama 3.2

推荐理由:做架构搜索或智能体系统的开发者值得一看——AIRA 用双智能体分工策略解决了搜索效率问题,而且思路可以迁移到管道组装、查询规划等场景,直接参考论文实现。
原文
精选全部日报登录