10:54小互@imxiaohu71°字节跳动旗下AI聊天应用豆包推出专业版,正式开启付费,月费68元起。专业版由豆包2.1Pro模型驱动,能力与opus 4.6相当,专注应用开发、数据分析等专业工作场景。它支持办公任务模式,可操作本地电脑、浏览器、调用Skills技能和定时任务,并内置Office办公套件。定价分三级:标准68元、加强200元、高级500元/月。学生认证后标准套餐可享38元/月优惠。AI产品豆包字节跳动办公助手AI办公推荐理由:豆包专业版收费了,68元起,能帮你操作电脑、用Office,还能写代码做分析,学生更便宜,想试试生产力型AI可别错过。原文
23:26歸藏(guizang.ai)@op7418作者测试了 Seed 2.1 Pro,发现它在智能体和编程任务上的短板已被补上。该模型现在能更流畅地处理复杂代理场景。作者计划将 Seed 2.1 Pro 作为内容创作的主要模型。AI模型Seed 2.1 Pro豆包智能体编程助手内容创作3 个信源在谈推荐理由:豆包刚更新的 Seed 2.1 Pro,智能体和编程短板都补上了,做内容创作更顺手,可以试一下。原文
14:48orange.ai@oran_ge豆包音频生成模型 Seed Audio 1.0 发布,可根据想象生成人声、音乐、音效和环境音。与传统的 TTS(仅文本转语音)不同,它能捕捉声音中的微妙细节。这是首次将智能赋予声音的模型,类似图像领域的 Seedance 时刻。AI产品豆包Seed Audio 1.0音频生成多模态声音模型3 个信源在谈推荐理由:豆包发了 Seed Audio 1.0,不光能念稿,还能生成音乐和音效,像声音版的 DALL·E,值得听听。原文
14:36小互@imxiaohu豆包实时语音模型3.0 API 正式上线,支持全双工模式,可同时听和说并随时插话。采用端到端语音进语音出,无需转录,响应更快更自然。模型能精准遵循指令,例如在多人聊天中设定规则后静待话题出现再参与。支持自定义工具调用,可在实时对话中完成预定日历、发邮件、总结文档等任务,向语音 Agent 迈进。AI模型豆包实时语音模型3.0全双工语音Agent工具调用推荐理由:豆包出了3.0语音模型,能同时听说、随时插话,还能在对话里调工具办事情,比传统语音助手强一大截。原文
08:05orange.ai@oran_ge晚点对豆包的报道揭示了其AI聊天机器人的胜利,但这场胜利的价值难以量化。豆包曾尝试推出800万个智能体,但除主智能体外其他智能体活跃度低,下架后用户留存未受影响。2024年上半年,团队因多bot尝试受挫而迷茫,曾考虑推荐抖音内容以提高留存,但最终未上线。豆包日均使用时长稳定在10分钟以内,远低于抖音的120分钟,尚未对传统互联网产品构成威胁。AI产品豆包AI聊天机器人智能体用户留存产品策略推荐理由:豆包的故事揭示了AI聊天机器人产品化的真实困境——用户留存和智能体生态的挑战,做AI产品的团队看完会反思自己的策略。原文
22:36向阳乔木@vista8豆包大模型家族首款全模态理解模型 Doubao-Seed-2.0-lite 0428 开始内测,新增音频理解能力,支持图片、视频、音频、文本四种输入。该模型在 Agent、Coding、GUI 能力上也有明显提升。测试案例包括前端动效复刻、视频 Hooks 建议、字幕识别等。目前第三方 AI Chat 客户端普遍不支持音视频上传解析,限制了该模型的应用。AI模型豆包Doubao-Seed-2.0-lite全模态理解音频理解多模态模型推荐理由:豆包终于补齐了音频理解短板,做多模态应用的开发者可以直接拿 API 测试前端动效复刻、视频分析等场景,比之前只能处理文本和图片强太多。原文
17:19歸藏(guizang.ai)@op7418本文对比了移动端和桌面端语音输入法的设计差异。作者指出移动端语音输入法必须配备全键盘以方便用户编辑,而桌面端语音输入法则最好与输入法解耦以实现更灵活的交互。Typeless犯了移动端无全键盘的错误,豆包则犯了桌面端与输入法耦合的错误。AI产品语音输入产品设计Typeless豆包交互体验推荐理由:观点鲜明地指出了主流语音输入产品在设计上的关键误区,对产品设计和用户体验优化有参考价值。原文