09:50rohanpaul_ai@rohanpaul_ai《自然医学》一项研究对比了OpenEvidence、UpToDate Expert AI与GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6在医学考试题、临床风格回答及医生真实提问上的表现。在100个脱敏临床问题中,盲审医生更偏好前沿通用模型,尤其在完整性和清晰度上胜出。结果显示通用LLM在医生评审的临床任务中已超越专用医疗AI产品。论文GPT-5.2Gemini 3.1 ProClaude Opus 4.6Nature Medicine医疗AI推荐理由:通用模型在医疗任务上反超专用AI原文
16:07宝玉@dotey宝玉(@dotey)对其群聊总结 Skill 进行了小功能更新,现在用户在群里 @bot 并请求总结群聊记录时,机器人能够结合聊天记录的上下文,在总结的同时回复用户的问题。该 Skill 依赖于 wx-cli 读取微信群聊数据,推荐使用 Claude Code + Claude Opus 4.6 获得最佳效果。这一更新提升了群聊助手的交互性和实用性,让总结不再只是单向输出,而是能针对性地回答用户疑问。技巧群聊总结微信机器人Claude CodeClaude Opus 4.6开源/仓库推荐理由:做微信群聊自动化或社群运营的开发者,可以试试这个 Skill——它让 bot 不仅能总结,还能结合上下文回答问题,比单纯罗列消息更实用。原文
22:17lmarena.ai@lmarena_ai73°斯坦福AI指数报告显示,中美AI模型差距已从三年前的278%缩小至仅2.7%。实际评测中,Anthropic的Claude Opus 4.6 Thinking与百度的Ernie 5.1在Text Arena排行榜上紧咬,美国虽仍居第一,但差距持续收窄。这一趋势反映了中国AI模型的快速追赶,尤其在推理和对话能力上。对关注全球AI竞争格局的从业者而言,这是重要的风向标。行业中美AI竞争模型评测Claude Opus 4.6百度Ernie 5.1Text Arena10 个信源在谈推荐理由:中美AI差距从278%缩到2.7%,做模型评测或关注国际竞争的团队值得一看——百度Ernie 5.1已经能跟Claude Opus 4.6 Thinking掰手腕了。原文