11:45Stanford AI Lab@StanfordAILab斯坦福AI实验室发布了Auto-psych系统,让AI智能体自主提出心理学理论、设计实验、在线招募真实人类参与者,并根据实验结果迭代改进。该系统实现了从理论到验证的闭环自动化,无需人工介入实验设计和数据收集环节。这是将大语言模型智能体应用于社会科学实证研究的一次实践。AI模型Auto-psychStanford智能体自动化科研心理学研究推荐理由:斯坦福AI实验室搞了个Auto-psych,AI智能体自己就能跑通心理学研究整个流程,从提理论到找人做实验再到改进,省掉了人工操作。原文
14:15AlphaSignal@AlphaSignalAI74°斯坦福大学和卡内基梅隆大学团队提出了一种名为Agent-Native Research Artifact的新研究格式。该格式替代传统论文,同时包含声明推理、可执行代码、失败实验日志和原始结果。对比测试中,AI的理解评分从72.4%提升到93.7%,复现评分从57.4%提升到64.4%。研究团队认为,这可能是人类撰写最后一篇论文的转折点。论文Agent-Native Research ArtifactStanfordCMU学术论文AI可执行推荐理由:斯坦福和CMU搞了个新格式叫Agent-Native Research Artifact,它把代码、失败记录都塞进去后,AI理解能力从72%跃升到93%,复现也涨了7个百分点,比读传统论文好用多了。原文
01:40Clement Delangue@ClementDelangue精选斯坦福大学研究显示,本地模型在真实世界聊天和推理查询中的准确率从2023年的23.2%提升至71.3%。该研究对比了本地模型与前沿API的成本和能耗,发现本地模型以极低代价实现了大部分任务。研究指出,多数工作负载无需依赖前沿模型,未来将是本地、开源、较小模型的天下。论文Stanford本地模型前沿API推理模型推荐理由:本地模型性价比超高原文