全部 AI 动态 · AI 热点

6月24日

10:54

10:54

小互@imxiaohu

71°

字节跳动旗下AI聊天应用豆包推出专业版，正式开启付费，月费68元起。专业版由豆包2.1Pro模型驱动，能力与opus 4.6相当，专注应用开发、数据分析等专业工作场景。它支持办公任务模式，可操作本地电脑、浏览器、调用Skills技能和定时任务，并内置Office办公套件。定价分三级：标准68元、加强200元、高级500元/月。学生认证后标准套餐可享38元/月优惠。

AI产品豆包字节跳动办公助手 AI办公

推荐理由：豆包专业版收费了，68元起，能帮你操作电脑、用Office，还能写代码做分析，学生更便宜，想试试生产力型AI可别错过。

6月23日

23:26

23:26

歸藏(guizang.ai)@op7418

作者测试了 Seed 2.1 Pro，发现它在智能体和编程任务上的短板已被补上。该模型现在能更流畅地处理复杂代理场景。作者计划将 Seed 2.1 Pro 作为内容创作的主要模型。

AI模型 Seed 2.1 Pro 豆包智能体编程助手内容创作

推荐理由：豆包刚更新的 Seed 2.1 Pro，智能体和编程短板都补上了，做内容创作更顺手，可以试一下。

14:48

14:48

orange.ai@oran_ge

豆包音频生成模型 Seed Audio 1.0 发布，可根据想象生成人声、音乐、音效和环境音。与传统的 TTS（仅文本转语音）不同，它能捕捉声音中的微妙细节。这是首次将智能赋予声音的模型，类似图像领域的 Seedance 时刻。

AI产品豆包 Seed Audio 1.0 音频生成多模态声音模型

推荐理由：豆包发了 Seed Audio 1.0，不光能念稿，还能生成音乐和音效，像声音版的 DALL·E，值得听听。

6月19日

14:36

14:36

小互@imxiaohu

豆包实时语音模型3.0 API 正式上线，支持全双工模式，可同时听和说并随时插话。采用端到端语音进语音出，无需转录，响应更快更自然。模型能精准遵循指令，例如在多人聊天中设定规则后静待话题出现再参与。支持自定义工具调用，可在实时对话中完成预定日历、发邮件、总结文档等任务，向语音 Agent 迈进。

AI模型豆包实时语音模型3.0 全双工语音Agent 工具调用

推荐理由：豆包出了3.0语音模型，能同时听说、随时插话，还能在对话里调工具办事情，比传统语音助手强一大截。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月22日

08:05

08:05

orange.ai@oran_ge

晚点对豆包的报道揭示了其AI聊天机器人的胜利，但这场胜利的价值难以量化。豆包曾尝试推出800万个智能体，但除主智能体外其他智能体活跃度低，下架后用户留存未受影响。2024年上半年，团队因多bot尝试受挫而迷茫，曾考虑推荐抖音内容以提高留存，但最终未上线。豆包日均使用时长稳定在10分钟以内，远低于抖音的120分钟，尚未对传统互联网产品构成威胁。

AI产品豆包 AI聊天机器人智能体用户留存产品策略

推荐理由：豆包的故事揭示了AI聊天机器人产品化的真实困境——用户留存和智能体生态的挑战，做AI产品的团队看完会反思自己的策略。

5月16日

22:36

22:36

向阳乔木@vista8

豆包大模型家族首款全模态理解模型 Doubao-Seed-2.0-lite 0428 开始内测，新增音频理解能力，支持图片、视频、音频、文本四种输入。该模型在 Agent、Coding、GUI 能力上也有明显提升。测试案例包括前端动效复刻、视频 Hooks 建议、字幕识别等。目前第三方 AI Chat 客户端普遍不支持音视频上传解析，限制了该模型的应用。

AI模型豆包 Doubao-Seed-2.0-lite 全模态理解音频理解多模态模型

推荐理由：豆包终于补齐了音频理解短板，做多模态应用的开发者可以直接拿 API 测试前端动效复刻、视频分析等场景，比之前只能处理文本和图片强太多。

5月12日

17:19

17:19

歸藏(guizang.ai)@op7418

本文对比了移动端和桌面端语音输入法的设计差异。作者指出移动端语音输入法必须配备全键盘以方便用户编辑，而桌面端语音输入法则最好与输入法解耦以实现更灵活的交互。Typeless犯了移动端无全键盘的错误，豆包则犯了桌面端与输入法耦合的错误。

AI产品语音输入产品设计 Typeless 豆包交互体验

推荐理由：观点鲜明地指出了主流语音输入产品在设计上的关键误区，对产品设计和用户体验优化有参考价值。