13:05@atomic_chat_hq@atomic_chat_hq精选Kimi K2.7 Code在三个物理模拟任务上与GPT-5.5进行对比,使用相同的提示词。弹簧摆和1kg块碰撞100000kg块的任务两者表现持平。但在22球自旋六边形任务中,Kimi生成的球随滚筒旋转,而GPT-5.5的球呈现混沌运动,Kimi表现更优。Kimi推理成本为0.28美元(52.4k tokens),GPT-5.5为0.93美元(23.4k tokens),成本降低约70%。AI模型KimiK2.7 CodeGPT-5.5推理模型编程助手推荐理由:Kimi新出的K2.7 Code模型,花不到三毛钱就能和GPT-5.5打平手,物理模拟甚至更聪明,性价比直接秒杀。原文
00:35Geek@geekbb从2022年期待本地运行ChatGPT-3.5,到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期,社区感叹没有尽头。行业DeepSeekQwenGLMKimi国产模型推荐理由:这帖子把2022到2026国产模型进化史盘得清清楚楚,DeepSeek、Qwen、GLM、Kimi每月一个旗舰,本地部署清单都快十个版本了,AI发烧友必看。原文
06:57Jim Fan@jimfan在一项无法在物理世界中被攻破的基准测试中,OpenAI Codex 的表现超越 Anthropic Claude,而 Claude 又优于月之暗面 Kimi。该基准由 @DrJimFan 参与的论文提出,专注于物理世界的真实场景评估。结果显示了各模型在复杂物理任务上的相对排名。AI模型CodexClaudeKimi基准测试物理世界10 个信源在谈推荐理由:英伟达科学家发推说他们论文里 Codex 把 Claude 和 Kimi 都干掉了,还是物理世界实测,看看你家模型排第几。原文
09:32lmarena.ai@lmarena_ai精选Kimi-K2.7-Code是Kimi新发布的编码模型,在Code Arena: Frontend中排名第3(开源模型),整体第19。相比K2.6,该模型在Kimi Code Bench v2上提升21.8%,Program Bench提升11.0%,MLS Bench Lite提升31.5%。推理效率提升,推理token使用量降低30%。模型已通过Kimi API和Kimi Code开源提供。AI模型Kimi-K2.7-CodeKimiCode Arena开源模型编码模型3 个信源在谈推荐理由:Kimi新出的编码模型K2.7-Code,在Code Arena前端排名第三,比上代提升明显,推理更省token,开源可玩。原文
09:32lmarena.ai@lmarena_aiKimi-K2.7-Code 在 Code Arena: Frontend 基准测试中排名第19位。该基准评估前端代码生成能力。作者提示 Agent Arena 的分数即将发布。AI模型KimiK2.7-CodeCode Arena前端代码智能体推荐理由:Kimi 的新代码模型在前端任务上排到第19,想看Agent成绩的可以蹲一下。原文
02:01lmarena.ai@lmarena_ai精选Kimi 发布并开源了最新编程模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理效率优化,推理 token 使用量降低 30%。支持长程编程任务,指令遵循和端到端成功率更高。模型已通过 Kimi API 和 Kimi Code 提供。AI模型Kimi-K2.7-CodeKimi开源模型编程助手推理模型5 个信源在谈推荐理由:Kimi 开源新编程模型,性能全面超越前代原文
17:52orange.ai@oran_geFable 5 模型因美国政府以国家安全为由要求 Anthropic 下架,已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code,相比 K2.6 提升 20% 编码能力,思考 token 减少 30%,API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2,强调前沿智能应开放可用。行业Fable 5AnthropicKimiK2.7 CodeGLM 5.2开源模型10 个信源在谈推荐理由:Fable 5 下架,Kimi 和智谱发新模型原文
13:09elvis@omarsar0精选Omar Sanseviero分享运行自主长时编码智能体的经验,建议用Opus 4.8做规划、GPT-5.5执行,并用Deepseek、Qwen、Kimi或MiniMax等模型作为评估器。他强调多模态目标比纯文本目标更强,能帮助智能体保持方向。清晰定义目标、消除模型假设、避免奖励黑客行为是关键。技巧Opus 4.8GPT-5.5DeepseekQwenKimiMiniMax智能体7 个信源在谈推荐理由:Opus 4.8+GPT-5.5分工跑长任务原文
10:18berryxia@berryxia精选73°Kimi 发布 K2.7-Code 模型,开源权重和代码至 Hugging Face。相比上一代,token 消耗减少 30%,agent 长任务成功率提升。在 Kimi Code Bench v2 上提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。模型通过高效推理解决 coding model 过度思考问题,并预告 6x High-Speed Mode。AI模型KimiK2.7-Code开源模型编程助手推理模型推荐理由:Kimi 开源新模型,少烧 token 还能干更多活原文
21:56vLLM@vllm_projectKimi 发布 K2.7-Code,一个专注于编程的智能体模型,基于 K2.6 构建。该模型采用 1T 参数的混合专家架构,每次推理仅激活 32B 参数,配备 MLA 注意力机制和 256K 上下文窗口。相比 K2.6,K2.7-Code 的思考 token 减少了约 30%,推理更高效。该模型已获 vLLM 支持,可直接复用 K2.6 的部署配置,降低了迁移成本。AI模型编程智能体MoE/混合专家Kimi推理模型vLLM推荐理由:编程智能体模型终于有了更高效的选择——K2.7-Code 在保持 1T 参数规模的同时,将激活参数压缩到 32B,做代码生成和推理的开发者可以直接在 vLLM 上复用现有部署,值得一试。原文
21:33kimi_moonshot@kimi_moonshot月之暗面发布并开源了最新编程模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。该模型减少了过度思考,推理 token 使用量降低 30%,同时改进了长时编程任务中的指令遵循和成功率。模型已通过 Kimi API 和 Kimi Code 可用,即将推出 6 倍高速模式。AI模型编程模型开源/仓库推理效率智能体Kimi推荐理由:Kimi-K2.7-Code 在编程和智能体任务上显著超越前代,且推理更高效,做 AI 编程或智能体开发的团队可以直接通过 API 或 Kimi Code 试用,值得关注。原文
20:13shao__meng@shao__meng73°Kimi 开源了最新编码模型 K2.7-Code,基于 K2.6 针对编程 Agent 专项优化,重点提升长链路编码任务成功率并减少推理 token。在编码基准上全面进步,其中 Kimi Code Bench v2 提升 21.8%,MLS Bench Lite 提升 31.5%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8 的 76.4,在多工具编排上具备竞争力。效率方面,推理 token 整体减少约 30%,Program Bench 的 token 消耗降低 42% 同时分数提升。模型支持强制 Thinking 模式、Preserve Thinking 和多模态输入,已在 Hugging Face 开源。AI模型KimiK2.7-Code编码模型AgentMCP/工具开源/仓库推荐理由:K2.7-Code 在 MCP 场景下超过 Opus 4.8,且推理 token 减少 30%,做编程 Agent 的团队可以直接用开源模型跑长任务,成本更低、成功率更高。原文
07:58berryxia@berryxia78°Kimi 推出新功能 Kimi Work,可在本地桌面同时运行多达 300 个 AI 代理,支持 macOS 和 Windows。这些代理通过 WebBridge 扩展能自主在浏览器中搜索、滚动、点击和输入,完成复杂任务。该功能专为财经场景优化,可直接调用 Yahoo Finance 和世界银行数据,无需额外配置。Kimi Work 还具备记忆系统,能记录用户偏好和决策,逐步提升个性化体验。最终,代理会自动将结果输出为 PPTX、Word、PDF 或 Excel 文件,直接保存到桌面。这标志着 AI 代理从云端依赖转向本地原生协作,显著提升桌面生产力。AI产品KimiAI代理本地部署财经场景桌面生产力7 个信源在谈推荐理由:Kimi Work 把 AI 代理从云端拉回本地,300 个代理并行干活还带记忆,做金融分析或数据整理的团队可以直接上手,省去配置和等待的麻烦。原文
04:41kimi_moonshot@kimi_moonshot78°Kimi Work 是一款桌面端本地 AI 智能体,支持最多 300 个 AI 代理并行运行。它通过 WebBridge 扩展可操控浏览器完成搜索、点击等任务,内置金融数据工具(Yahoo Finance、世界银行),无需复杂 API 配置。还具备记忆系统,能记录用户偏好和上下文,提升个性化体验。目前支持 macOS(Apple Silicon)和 Windows,可直接下载试用。AI产品智能体本地部署金融工具浏览器自动化Kimi7 个信源在谈推荐理由:本地运行 300 个 AI 代理并行工作,解决了云端依赖和效率瓶颈,做自动化办公或金融分析的团队可以直接上手试试。原文
12:34orange.ai@oran_ge有投资人爆料称 Anthropic 的 Claude 模型蒸馏了中国模型 Kimi 和 Qwen,而非此前猜测的 Cursor。该说法最初在私下交流中传出,如今似乎有更多证据浮出水面。事件折射出 AI 行业模型蒸馏现象的普遍性与真假难辨的现状。作者调侃称责任全在崔茂。行业AnthropicClaude蒸馏KimiQwen10 个信源在谈推荐理由:模型蒸馏争议触及 AI 行业的核心竞争与伦理问题,关注大模型生态的从业者和投资人值得一读,看完会对行业潜规则有新认识。原文
02:34TestingCatalog@testingcatalogKimi 推出了名为 Kimi Web Bridge 的浏览器扩展,旨在为多种 AI 智能体(如 Claude Code、Hermes、Codex、Kimi Code CLI 等)提供统一的浏览器操作接口。该扩展解决了不同智能体各自需要独立浏览器集成的问题,让开发者只需安装一个扩展即可让多个智能体共享浏览器控制能力。这降低了智能体工具链的碎片化,提升了开发效率。目前该扩展已可用,适合需要同时使用多个 AI 编程助手的团队。AI产品Kimi浏览器扩展智能体MCP/工具编程助手推荐理由:Kimi 用一个扩展解决了多智能体各自为战的浏览器控制问题,做 AI 编程或自动化测试的开发者不用再为每个工具装不同插件,值得直接上手试试。原文
01:07shao__meng@shao__mengKimi 发布了名为 Kimi Web Bridge 的浏览器扩展,能将编码型或通用型 AI Agent 接入用户本地的 Chrome/Edge 浏览器,使其具备点击、滚动、输入、抓取、截图等真实网页操作能力。该扩展复用用户真实浏览器而非新建沙箱,完全本地化执行,且开放接入而非闭环产品。官方展示了四个案例:跨平台批量搜索并写表格、看网站后复刻、从日常操作学习技能、自动填写 Google Form。这一工具让 Agent 从“看”网页升级为“操作”网页,显著扩展了自动化场景。AI产品Kimi浏览器扩展Agent自动化网页操作推荐理由:做自动化流程或 Agent 开发的团队终于有了一个直接操作真实浏览器的工具——Kimi Web Bridge 让 Agent 能像人一样点击、填表、抓取,建议搞 RPA 或浏览器自动化的开发者立刻试试。原文
00:59berryxia@berryxiaKimi 发布了 Web Bridge 浏览器扩展,使 AI Agent 能像人类一样在浏览器中搜索、滚动、点击和输入,完成整套任务。演示视频显示,Agent 可同时在多个平台搜索并自动整理到 Excel,也能分析网页结构并复制内容,甚至根据对话自动创建调研问卷。该扩展原生支持 Kimi Code CLI、Claude Code、Cursor 等工具,解决了 AI Agent 只能看不能动的痛点。Web Bridge 已在 Chrome 应用商店上线,用户可免费试用。AI产品KimiWeb BridgeAI Agent浏览器扩展自动化7 个信源在谈推荐理由:Kimi 把 AI Agent 从“只会聊天”拉到“能操作浏览器”的维度,做自动化、信息收集或开发测试的团队可以直接安装试试,效率提升肉眼可见。原文
15:02kimi_moonshot@Kimi_Moonshot月之暗面发布了 Kimi K2.6 Agent Swarm,将并行子智能体数量从 K2.5 的 100 个提升至 300 个,每次运行步数从 1500 步增加到 4000 步。该版本支持输出真实文件而非聊天内容,一次运行可生成 100+ 文件、10 万字文献综述或 2 万行数据集。K2.6 集成了搜索、分析、编程、长文写作和视觉生成等多种异构技能,所有技能可并行运行。用户可通过提供的链接直接体验。AI产品智能体并行计算Kimi月之暗面多模态推荐理由:K2.6 将并行子智能体规模提升 3 倍,做复杂研究或数据处理的团队可以一次跑出完整报告和数据集,效率提升明显,值得直接上手试。原文
15:02kimi_moonshot@Kimi_MoonshotKimi K2.6 在 OpenRouter 的每周大语言模型排行榜中升至第一名。这一成绩反映了开发者社区对 Kimi 模型的认可和实际使用效果。Kimi 团队对开发者的支持表示感谢,并承诺将继续迭代优化。对于关注模型性能排名的开发者来说,这是一个值得关注的动态。AI模型KimiK2.6OpenRouter排行榜大语言模型推荐理由:Kimi K2.6 在 OpenRouter 周榜登顶,说明它在实际使用中获得了开发者认可,做模型选型或对比的团队可以关注这个新选择。原文
19:15Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue在特朗普与习近平会晤期间,呼吁美国AI社区公开支持开源国际AI,特别是来自中国的Deepseek、Qwen、Kimi、GLM等模型。他强调开源是当前AI领域竞争、就业和财富创造的最重要驱动力。此举意在关键时刻维护开源合作,避免地缘政治影响技术交流。行业开源/仓库DeepseekQwenKimiGLM推荐理由:开源AI社区正面临地缘政治压力,Hugging Face CEO的呼吁提醒从业者:支持开源模型(尤其是中国模型)关乎整个行业的竞争力和创新活力。做AI开发或关注开源生态的人,值得关注这一立场。原文