17:02李继刚@lijigang_com分享者提出用AI从媒介、梯度、Build三个角度辅助孩子学习。通过图片、视频、游戏等多媒体形态加深理解;针对每个孩子的理解水平生成符合「最近发展区」的题目;鼓励孩子边学边创造,如制作游戏、网页、小程序并分享给同学。这种方法可以提升学习效果并培养创造习惯。技巧学习技巧教育AI媒介梯度创造推荐理由:三个具体可操作的角度,直接用AI帮孩子学习,比光讲理论实在。原文
11:40arXiv cs.AI@Alexandra Neagu, Jeffrey T. H. Wong, Marcus Messer, Rhodri Nelson, Peter B. Johnson该论文引入了一个评估管道,包含两个指标——聊天机器人脚手架和学生吸收率,并在9个数据集(共9490个对话)上应用,涵盖AI导师基准测试和现实部署。分析发现,基准测试假设高脚手架、高学生吸收率环境,但现实中的学生整体吸收率较低,经常绕过聊天机器人的教学框架。论文认为,绕过脚手架不一定有害,反而常突显了聊天机器人的教学框架与学生目标之间的不匹配。未来基准测试应评估聊天机器人如何导航多样化的学习情境和学生驱动的交互模式。论文LLM辅导员脚手架学生吸收率基准测试教育AI推荐理由:这篇论文用9490个对话数据证明,AI辅导系统在测试中的表现和实际使用差很多,学生根本不吃那套引导。做教育AI的值得看看。原文
12:31arXiv cs.AI@Mingjia Li, Jin Wu, Hong Qian, Wenhao Huang, Yiyang Huang, Yiwen Zhang, Chanjin Zheng, Xiangfeng Wang, Aimin Zhou, Jiajun Guo精选IntElicit 是一个用于评估情境化创造力的框架,它通过对话策略优化来减少认知能力和参与意愿等非创造性因素的干扰。该框架作为自适应 AI 面试官,在多轮交互中提供非指导性知识和参与支持,同时保留参与者生成创造性内容的责任。它引入分解过程奖励机制,避免奖励作弊,鼓励引导参与者推理而非直接给出答案。实验表明,IntElicit 能比专家设计的基线方法更好地激发创造性成果,揭示静态评估可能遗漏的创造潜力。这为 AI 辅助学习中的情境化创造力评估提供了形成性和诊断性视角。论文创造力评估对话策略优化AI面试官情境化评估教育AI推荐理由:做创造力评估或 AI 教育对话系统的研究者值得关注——IntElicit 解决了静态测试无法捕捉真实创造力的痛点,用对话策略优化让评估更贴近实际场景。原文
16:16IT之家(博客/媒体)阿里巴巴宣布千问上线国内首个全周期高考志愿填报Agent,基于千问高考志愿大模型和夸克8年数据打造,免费为全国考生提供志愿填报和咨询服务。该Agent具备“志愿日历”、“志愿报告”、“志愿问答”三项核心能力,能模拟人类专家思维,结合历年数据提供个性化建议。中国每年超1000万考生中,仅不到5%能聘请专业填报师,该工具旨在帮助剩余95%的家庭。志愿报告支持动态调整和自我检查,并针对乡村和弱网环境做了优化。AI产品阿里千问高考志愿填报Agent免费服务教育AI推荐理由:95%的考生家庭靠摸索填志愿,这个免费Agent直接复刻了人类专家的填报方法,做教育或关心高考的家长考生值得试试。原文
09:50pandaily@contact@pandaily.com (Pandaily)每年高考不仅是学生的战场,也成为中国科技巨头展示AI实力的舞台。今年,腾讯、阿里、百度、字节跳动等公司纷纷用自家大模型挑战高考题目,比拼解题能力和准确率。这些公司通过公开测试或直播形式展示AI在语文、数学、英语等科目上的表现,旨在证明其模型在复杂推理和知识应用上的进步。此举不仅为品牌营销,也反映了AI在教育领域的应用潜力,引发公众对AI能否超越人类考生的讨论。行业大模型高考教育AI腾讯阿里百度字节跳动1 个信源在谈推荐理由:高考AI比拼是检验大模型推理能力的绝佳场景,关注AI教育应用的开发者和教育从业者值得一看,看看哪家模型能真正“考”过人类。原文
16:36小互@imxiaohu76°Koji 是一款由 MIT 和哈佛学习专家训练的 AI 家教,号称全球首个「图形化私教」。它不像 ChatGPT 直接给答案,而是通过提问、引导、高亮屏幕内容等方式,逼学生自己推导出答案。Koji 能实时看见学生屏幕,知道学生卡在哪里,并主动开口引导,降低提问门槛。它支持图形化交互,比如在几何题中画测试点、在导数题中画切线,而不是只打字。视频展示了两例:几何题中引导学生推导方程,Python 课中提醒死循环但不给答案。AI产品AI家教图形化私教学习引导MIT/哈佛教育AI推荐理由:想让孩子真正学会思考、减少对AI依赖的家长和教育者,这款「反套路」AI家教值得关注——它用图形化引导替代答案灌输,直接解决AI时代学习能力退化的问题。原文
12:03arXiv cs.AI@Tahreem Yasir, Wenbo Li, Sam Gilson, Sutapa Dey Tithi, Xiaoyi Tian, Tiffany Barnes精选一项新研究评估了七个大型语言模型(LLM)在命题逻辑辅导中的诊断精度,使用知识图谱生成的10,836个解决方案-反馈对作为基准。结果显示,LLM在识别最优步骤上接近完美,但系统性地过度拒绝有效但次优的推理,并过度验证错误的解决方案——这正是自适应辅导最需要精准反馈的地方。这些失败在所有模型中一致出现,表明是架构限制而非信息不足。此外,准确诊断并不总能转化为可操作的反馈,揭示了诊断判断与教学效果之间的差距。研究建议,LLM更适合混合架构,由知识图谱模型负责诊断,LLM负责开放式引导和对话。论文LLM智能辅导系统教育AI知识图谱诊断精度推荐理由:做AI教育或智能辅导系统的开发者会发现,LLM在关键教学诊断上存在系统性盲区——它擅长确认正确,却搞不定“部分正确”和“错误”的微妙区分,这直接影响辅导质量。建议点开看看混合架构方案,或许能帮你避开部署中的坑。原文