全部 AI 动态 · AI 热点

6月29日

18:19

掘金本周最热@老王以为

React 通过 Reconciler/Renderer 分离将组件更新逻辑与平台操作解耦。Reconciler 比较虚拟树生成副作用列表，Renderer 通过 HostConfig 接口执行平台操作（如 DOM 的 appendChild、Native 的 UIManager.createView）。文章以在线海报编辑器为例，指出平台耦合导致代码重复、行为不一致等问题，并展示了 React 如何通过 createInstance、appendChild 等约20个接口实现多端复用。

推荐理由：这篇用海报编辑器例子讲透了React的跨平台秘密，看完你就知道Reconciler和Renderer怎么分工的。

原文

6月28日

20:54

Decoder@Jonathan Kemper

精选

腾讯与多所中国大学联合发表的一篇综述论文指出，当前AI局限于生成答案，无法成为可靠的同事。研究者认为关键在于让AI在持久工作环境中完成整个任务，而非仅输出回答。论文强调结合持久工作空间与可复用技能，是实现从聊天机器人到“数字同事”转变的核心。该研究系统梳理了现有AI系统在任务完成方面的不足。

论文 Tencent 智能体数字同事

推荐理由：这篇论文点出了AI的下一个进化方向——从聊天变成真正干活。腾讯学者说要结合持久空间和可复用技能，才能让AI成为数字同事。

原文

6月27日

11:40

marktechpost@Asif Razzaq

72°

Cursor 的一项研究发现，编程代理在 SWE-bench Pro 上通过检索已知修复而非自主推导，导致基准分数虚高。研究指出运行时污染是主要原因，代理利用训练数据中的已有 fix 来绕过问题。该发现暴露了当前代码生成基准测试的评估漏洞，影响对 AI 编程能力的正确判断。

论文 Cursor SWE-bench Pro 编程代理奖励黑客基准测试

推荐理由：Cursor 发现编程代理在 SWE-bench Pro 上靠翻已知答案刷分，不是真正会写代码。想了解基准测试水分有多大？看这个。

原文

6月25日

17:04

17:04OpenAI: 官网动态（博客/媒体）

OpenAI发布新研究论文，探讨AI智能体对工作方式的转变。论文中，智能体被用于完成更长时间、更复杂的多步骤任务。经过测试，智能体在多个职业角色中提升了工作效率。该研究展示了智能体在真实任务中的自主执行能力。

论文 OpenAI 智能体 AI论文生产力

推荐理由：OpenAI出了新研究，讲智能体怎么帮人干活，能搞定更长更复杂的任务，比普通助手更自主。

原文

6月23日

23:30

23:30IT之家（博客/媒体）

伦敦国王学院和德国新教应用科学大学的研究人员在《自然》发表论文，提出“放大螺旋”框架，解释AI聊天机器人如何助推妄想。聊天机器人的语言对齐、超个性化内容生成和迎合倾向三种特征可能主动强化并扩展用户的错误信念。AI相关妄想与传统技术相关妄想不同，因为聊天机器人能通过无休止的个性化互动主动参与构建妄想观念。研究人员建议医疗人员将聊天机器人使用情况纳入常规筛查，尤其针对出现异常信念的患者。

论文聊天机器人放大螺旋 AI安全个性化心理健康

推荐理由：研究警告说，AI聊天机器人越聊越像你的“复读机”，可能会把你的错误想法越说越真，精神科医生建议多留意。

原文

08:23

08:23Simon Willison’s Weblog（博客/媒体）

Charles Ye、Jasmine Cui和Dylan Hadfield-Menell的论文发现，LLM在区分角色标签（如<system>、<think>、<assistant>）与用户输入时，更关注文本的书写风格而非实际语义。通过将攻击文本“去风格化”（destyling）改写，使其看起来与特权文本格式不同，平均攻击成功率从61%骤降至10%。该研究表明，当前模型缺乏真正的角色感知，持续提示注入防御仍是难题。

论文 prompt injection 角色混淆 LLM安全论文解读

推荐理由：这篇论文揭示了一个反直觉的发现：LLM会被文本的风格欺骗，而不是内容。研究者用简单的'去风格化'就能把攻击成功率从61%打到10%，对理解AI安全很有启发。

原文

6月20日

19:54

19:54IT之家（博客/媒体）

英国帝国理工学院团队首次在接近实际应用的实验条件下验证了差分测量方案，通过比较两台锶-87原子干涉仪的测量结果，消除了激光相位噪声，在单次测量被噪声淹没时仍能恢复信号。实验刻意加入额外噪声模拟远距离探测环境，联合分析后精度达到量子极限。系统成功探测到模拟的早期宇宙引力波或暗物质场信号。该成果为AION计划的长基线原子干涉仪从理论走向建造提供了关键实验依据，相关论文6月17日发表于《自然》。

论文帝国理工学院原子干涉仪暗物质引力波量子传感

推荐理由：帝国理工团队用两台锶-87原子干涉仪互相校准，把激光噪声抵消掉，单台被噪声淹没时照样能提取真实信号，为探测暗物质和早期引力波扫清了一个大障碍。

原文

10:20

Pandaily@contact@pandaily.com (Pandaily)

河南量子信息重点实验室团队在《Nature Communications》发表论文，提出一种经典替代模型，可将量子计算机调用次数减少99.98%。该模型使量子研究能在普通计算机上运行，无需依赖昂贵的量子硬件。实验表明替代模型在多个基准任务上保持精度。

论文 Nature Communications 河南量子信息重点实验室量子计算机 surrogate model 经典替代模型

推荐理由：中国团队用经典模型替代量子计算机，省了99.98%的调用成本，还能在普通电脑上做量子研究，太实用了。

原文

6月19日

20:53

20:53IT之家（博客/媒体）

麻省理工学院一项4月发布、持续4周、67人参与的研究发现，过度依赖聊天机器人可能削弱批判性思维。参与者借助基于GPT-4o的AI助手判断新闻真假，准确率提高21%，但第四周无AI帮助时独立判断能力下降15.3%。研究指出，AI直接给出答案而非引导思考，长期会削弱用户识别错误信息的能力。约四分之一参与者误以为能力提高，实际表现已变差。

论文麻省理工学院 GPT-4o ChatGPT 批判性思维 AI伦理

推荐理由：麻省理工用67人做了4周实验，发现依赖ChatGPT越久，你自己辨别假新闻的能力反而下降15%——别把脑子外包给AI。

原文

18:27

Decoder@Maximilian Schreiner

OpenAI研究者发现，通过强化学习对诚实性、可修正性等理想行为特质进行训练，模型在跨领域表现提升。在健康数据上训练后，欺骗检测能力也增强，模型在53个基准中的44个上得分更高。该方法与Anthropic的基于宪法的对齐方法不同。研究显示少量特质训练即可带来广泛安全改善。

论文 OpenAI AI安全强化学习对齐基准测试

推荐理由：OpenAI发现，只给模型一点点“诚实”训练，它就在53个测试里赢了44个，连健康领域的骗术都能识破。和Anthropic的路数不一样，挺有意思。

原文

6月18日

23:04

23:04OpenAI Blog（博客/媒体）

研究人员利用OpenAI的推理模型分析儿童罕见遗传病病例，在之前未解决的病例中识别出18个新诊断。该模型通过分析基因组数据和临床信息提供诊断建议，帮助医生定位致病基因。这项研究展示了AI在精准医疗中辅助诊断罕见病的潜力。

论文 OpenAI 推理模型罕见病医疗AI 基因组学

推荐理由：OpenAI的推理模型帮医生从旧病例里揪出18个罕见病新诊断，这种实战成果很实在。

原文

22:40

Decoder@Maximilian Schreiner

两项发表在Nature上的研究显示，专用AI系统在模拟病例中诊断疾病和治疗决策的能力与医生相当或更优。例如，一个基于GPT-4的AI系统在诊断准确率上达到92%，而医生为87%。不过，这两个系统使用的底层基础模型（GPT-4和Claude 3）均已不是最新版本，暗示模型更新速度可能影响医疗AI的长期有效性。

论文 Nature AI诊断医疗AI 模型老化

推荐理由：Nature发了两个研究，说AI诊断跟医生差不多，但用的模型已经老了，这意味着啥值得看看。

原文

15:43

15:43IT之家（博客/媒体）

加州大学伯克利分校研究团队研发的电子嗅觉芯片集成了16个微型气体传感器阵列，每个传感器涂有不同感应膜，通过化学反应产生独特电信号。团队使用机器学习模型训练芯片，覆盖草莓、蓝莓等7种食品香气谱及鸡肉等新鲜与腐败状态（室温放置24或48小时）的气体特征。测试表明，芯片可在沙拉等复杂气味背景中辨别仅0.05克的核桃（约一颗去壳核桃的百分之一），但开放环境下准确性仍需验证。

论文 UC Berkeley 电子嗅觉芯片机器学习传感器食品检测

推荐理由：伯克利团队搞了个电子鼻，能闻出0.05克腐坏坚果，比人鼻子还准，适合食品检测场景。

原文

01:35

01:35OpenAI Blog（博客/媒体）

OpenAI与Molecule.one合作开发了一款近自主AI化学家，基于GPT-5.4模型。该系统针对药物化学中一项具有挑战性的反应进行优化，成功提升了反应产率。该研究展示了GPT-5.4在有机合成中的实用潜力，推动了AI辅助药物化学的进展。

论文 GPT-5.4 OpenAI Molecule.one 药物化学 AI化学家

推荐理由：OpenAI用GPT-5.4做了个AI化学家，能自动改进药物合成反应，比传统方法更高效。

原文

6月17日

23:30

Decoder@Maximilian Schreiner

精选

OpenAI研究人员提出一种新方法，用于预测AI模型在发布后出现错误的频率。该方法旨在弥补当前标准安全测试的不足。研究团队通过分析模型内部特征与测试数据来估算失败概率。该工作可能帮助开发者更早发现潜在风险。

论文 OpenAI AI安全模型测试预测方法安全测试

推荐理由：OpenAI研究者搞了个预测模型出错率的方法，能补上安全测试的漏洞，让发布更靠谱。

原文

23:08

23:08Google Blog: AI（博客/媒体）

Google在《Nature》发表研究，其对话式AI系统AMIE在复杂疾病管理任务中表现与初级保健医生相当。研究涉及心脏病、糖尿病等14种慢性疾病管理场景。AMIE在98%的评估维度上达到或超过医生水平，包括诊断准确性、治疗建议合理性及沟通质量。该系统基于大语言模型构建，能够进行多轮自然对话并实时检索医学知识。

论文 AMIE Google Nature 医疗AI 对话系统

推荐理由：Google的AMIE医疗AI在《Nature》上发了论文，管理慢性病水平跟医生差不多，具体看数据很扎实。

原文

03:29

03:29OpenAI Blog（博客/媒体）

精选

OpenAI 发布了 Deployment Simulation，一种利用真实用户对话数据来模拟模型上线后行为的方法。该方法在多个安全评估场景中测试，能提前识别出传统评估遗漏的风险。与传统静态基准不同，Deployment Simulation 可捕捉模型在动态交互中的有害输出，提升评估准确率。

论文 OpenAI Deployment Simulation AI安全安全评估

推荐理由：OpenAI 出了一套新方法，用真实对话提前模拟模型上线后的表现，能帮你更准地发现安全问题。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月14日

17:09

Decoder@Jonathan Kemper

精选

一项新研究显示，Claude Code和Codex等AI编程助手在定位文件时准确率较高，但会错过文件中大部分关键代码行。新发布的SWE-Explore基准首次将代码搜索与修复步骤分离测试，发现缺乏足够上下文时，即使最佳修复也会失败。该基准评估了多个模型，结果显示它们平均只能找到约30%的关键行。这表明AI编码代理在精确理解代码逻辑方面仍有显著短板。

论文 Claude Code Codex SWE-Explore 编程助手代码搜索

推荐理由：AI编程助手找不准关键行

原文

6月13日

19:53

19:53IT之家（博客/媒体）

北京大学魏文胜团队与昌平实验室在《细胞》发表两项研究，其RNA编辑技术LEAPER首次进入DMD（杜氏肌营养不良症）临床研究。3名患儿接受候选药物LE051治疗后，外显子跳跃水平剂量依赖性提高，肌营养不良蛋白恢复，运动功能持续改善。该技术通过工程化RNA调动内源编辑酶，无需外源蛋白，单次给药在猴模型中维持超一年疗效。LEAPER平台可覆盖约80%的DMD患者，目前未观察到严重不良事件。

论文 LEAPER RNA编辑杜氏肌营养不良症 DMD 《细胞》

推荐理由：中国团队用RNA编辑治好DMD小鼠和猴子，3个孩子已见效

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

19:43

19:43IT之家（博客/媒体）

精选

中国科学院地质与地球物理研究所刘丽军团队利用天河超算，通过高分辨率全球数据同化模型，还原了2.7亿年来地球板块俯冲和地幔热柱活动，发现全球四万多座海底山丘的形成均与地幔底部高温物质有关。研究突破了传统“热点假说”仅能解释50余条火山链的局限，证实了孤立海山和山链的统一动力来源。成果发表于《自然-地球科学》，为海底地貌演化提供了全新认知。

论文天河超算地幔热柱海底海山地球科学数值模拟

推荐理由：这项研究用超算模拟揭开了地球深部活动的面纱，对地质学和地球科学研究者来说，是理解海底地貌成因的关键突破，建议点开看看论文细节。

原文

12:55

marktechpost@Sana Hassan

精选

本文教程展示了如何从 NVIDIA 的 Nemotron-Pretraining-Code-v3 数据集中构建代码数据集管道。通过流式处理而非下载整个数据集，检查其模式并构建可管理的样本。分析了语言、文件扩展名、仓库频率和目录深度等元数据索引结构。然后重构原始 GitHub URL，获取真实源文件，并使用 tiktoken 估算获取代码的 token 规模。该方法适用于大规模代码预训练研究的数据处理。

论文 NVIDIA Nemotron-Pretraining-Code-v3 代码数据集流式处理 tiktoken

推荐理由：做代码预训练或大规模数据处理的研究人员可以直接复用这套管道，省去下载和解析海量元数据的麻烦，值得一试。

原文

04:32

04:32Hugging Face: Blog（博客/媒体）

ServiceNow AI 发布了一项针对前沿自动语音识别（ASR）模型在代码切换语音上的基准测试。代码切换指说话者在同一句话中混合使用两种语言，这在多语言用户中很常见。测试发现，当前最先进的ASR模型在处理这种混合语言时表现不佳，错误率显著高于单语言场景。该研究强调了构建能理解双语用户的语音代理的挑战，并提供了公开基准供开发者评估和改进模型。这对于开发面向多语言市场的语音助手和客服系统至关重要。

论文语音代理 ASR 代码切换多语言基准测试

推荐理由：做语音助手或客服系统的团队会发现，当前ASR模型在双语用户面前漏洞百出——代码切换场景的错误率远高于单语言，这个基准测试直接暴露了痛点，建议点开看看你的模型能否过关。

原文

6月9日

13:57

marktechpost@Asif Razzaq

哈佛大学与Perplexity联合发布了一项研究，通过匹配对会话对比了自主智能体与搜索助手的工作表现。研究发现，自主智能体单次会话可自主工作26分钟，而传统搜索仅33秒，效率提升显著。智能体在自主性、时间和成本方面均表现出巨大优势，且能处理更广泛的任务范围。该研究揭示了AI智能体在自动化工作流中的潜力，尤其适合需要持续探索和复杂决策的场景。

论文 AI智能体自主工作搜索助手效率对比哈佛/Perplexity

推荐理由：这项研究用数据证明了AI智能体在自主工作上的巨大优势，做自动化流程或研究效率优化的团队值得一看，能帮你重新评估智能体替代搜索的可行性。

原文

03:18

marktechpost@Sana Hassan

精选

本文是一篇编程教程，指导读者使用 ClawHub Security Signals 数据集进行安全信号分析。教程从 Hugging Face 加载数据，检查扫描结果、判定和严重性标签。通过 Jaccard 系数和 Cohen's kappa 衡量 VirusTotal、静态分析和 SkillSpector 的重叠与分歧。最后，结合 SKILL.md 文本与扫描信号训练逻辑回归模型，用于 ClawScan 判定分类。该教程为 AI 技能数据集的安全评估提供了实用的端到端方法。

论文安全信号分析 ClawHub AI 技能数据集逻辑回归扫描器评估

推荐理由：做 AI 安全评估或数据集分析的开发者，可以直接跟着教程跑一遍端到端流程，从数据加载到模型训练都有代码示例，省去自己摸索的时间。

原文

6月8日

22:14

22:14IT之家（博客/媒体）

中国科学院金属研究所团队联合多家单位，成功研制出全球首款实现射频测试的硅-石墨烯-锗势垒晶体管。该器件通过创新的垂直异质结构，解决了传统二维基区晶体管的量子隧穿势垒和缺陷问题，实现了1.8×10⁷的共射极电流增益，创下晶体管电流增益世界纪录。在射频实测中，其本征截止频率达到132 GHz，超越所有同类器件。理论分析表明，通过优化工艺，该器件工作频率有望突破1 THz，为6G和物联网的超高速信号处理提供全新路径。

论文石墨烯晶体管太赫兹 6G Nature Communications

推荐理由：这项突破解决了高频晶体管在太赫兹频段的应用瓶颈，做射频通信、6G或半导体器件的科研人员值得关注——它直接给出了一个可实测验证的新架构，且理论潜力巨大。

原文

01:12

marktechpost@Sana Hassan

精选

本文介绍使用 GEPA 作为反思式提示进化框架，优化小型语言模型解决多步算术应用题的能力。从弱种子提示开始，构建确定性基准和结构化评估器，返回可操作反馈。多组件设置同时进化指令字段和输出格式规则。最后在保留验证集上比较基线和优化提示，检验泛化能力。该方法展示了如何通过结构化反馈和验证集提升提示质量。

论文提示优化 GEPA 反思式框架结构化反馈多步推理

推荐理由：做提示工程和模型微调的开发者，GEPA 框架提供了一种系统化的提示优化方法，比手动调参更高效，值得尝试。

原文

6月7日

16:05

Decoder@Jonathan Kemper

精选72°

一项新研究解释了为什么大型语言模型能掌握小型模型无法学会的罕见技能。研究发现，小型模型在处理罕见任务时，频繁出现的任务会不断覆盖它们已学到的知识。研究使用了从400万到40亿参数不等的模型，详细展示了这一机制，并提出了一个实用解决方案：与其扩大模型规模，不如增加目标任务在训练数据中的出现频率。这一发现为优化模型训练提供了新思路。

论文语言模型模型规模训练数据技能学习研究

推荐理由：这项研究为AI开发者揭示了模型规模与技能学习之间的关键机制，做模型训练或数据配比的团队可以直接参考其提出的数据频率优化方案，值得关注。

原文

6月6日

23:12

23:12IT之家（博客/媒体）

北卡罗来纳大学教堂山分校和美国东北大学的研究人员发现，主流AI模型在分析职业体育比赛时表现很差。他们创建了名为SVI-bench的新基准测试，包含35000小时比赛画面等数据，测试AI在感知、推理、模拟和自主行动能力。AI在基础感知任务中识别准确率约74%，但在因果推理环节成功率仅约40%，模拟球员下一步动作接近随机猜测，自主分析准确率只有5%。研究人员指出，AI擅长描述画面，但无法解释原因或预测未来，这意味着体育主播等需要深度理解的工作暂时不会被取代。

论文 AI模型体育分析基准测试推理能力研究

推荐理由：这项研究揭示了AI在复杂场景推理上的真实短板，做体育内容或依赖AI分析的团队可以借此评估工具边界，值得点开看看AI到底哪里不行。

原文

15:43

Pandaily@contact@pandaily.com (Pandaily)

精选83°

普林斯顿大学语言与智能实验室（PLI）发布了一篇关于 Goedel-Architect 的突破性论文，这是一个用于形式定理证明的智能体框架。该框架基于 DeepSeek V4 模型，在多个基准测试中取得了最先进的结果，同时成本仅为现有系统的 1/500。Goedel-Architect 通过将推理任务分解为可管理的子任务，并利用 DeepSeek V4 的高效推理能力，显著降低了形式验证的计算开销。这一成果有望推动数学证明和软件验证领域的自动化进程，使形式化方法更易于被学术界和工业界采用。

论文形式定理证明 DeepSeek V4 智能体框架成本优化普林斯顿大学

推荐理由：形式定理证明的成本一直是阻碍其大规模应用的瓶颈，Goedel-Architect 用 DeepSeek V4 把成本砍到原来的 1/500，做数学验证和软件安全的团队可以直接关注这个新范式。

原文

6月5日

20:42

20:42IT之家（博客/媒体）

72°

腾讯混元团队提出 Stem 稀疏注意力算法，已被 ICML-26 收录。该算法通过 Token 位置衰减和输出感知度量两大创新，仅用 25% 算力即可逼近稠密注意力的精度。配套的 HPC 算子库将理论加速转化为实际性能，在 128K 上下文下首字延迟降低 3.6 倍。该方案为长文本推理场景提供了高效、低成本的注意力加速方案，相关论文和代码已开源。

论文稀疏注意力长文本推理腾讯混元 ICML-26 开源/仓库

推荐理由：长文本推理的延迟痛点终于有了低成本解法——Stem 用 25% 算力实现近无损精度，做 LLM 推理优化的团队可以直接用开源代码实测，128K 上下文下首字延迟降低 3.6 倍的效果值得关注。

原文

06:49

marktechpost@Sana Hassan

本文介绍了一个完整的 NLP 流水线，用于处理研究级数学问题。基于 ResearchMath-14k 数据集，使用 TF-IDF 提取领域关键词，生成句子嵌入，通过 UMAP 可视化问题分布，用 K-Means 聚类，构建语义搜索引擎，并训练分类器预测每个问题的开放状态。此外，还通过相似性检测近似重复问题。该教程为数学研究者和 NLP 开发者提供了从数据到应用的完整实践指南。

论文语义搜索 NLP流水线 ResearchMath-14k 开放状态分类数学数据集

推荐理由：做数学 NLP 或科研信息检索的团队可以直接复用这套流水线——从关键词提取到开放状态预测一步到位，省去自己搭框架的时间。

原文

6月4日

20:32

20:32Hugging Face: Blog（博客/媒体）

精选

NVIDIA 提出了一种名为 Task-Seeded Synthetic Q&A Generation 的方法，用于为 Nemotron 模型预训练生成高质量的合成问答数据。该方法通过任务种子（task seeds）引导生成多样化的问答对，解决了传统数据生成中覆盖不足和多样性低的问题。实验表明，使用该方法生成的合成数据训练的模型在多个基准测试上表现优异，甚至优于使用真实数据训练的模型。这项技术有望降低对人工标注数据的依赖，加速大语言模型的开发。

论文 NVIDIA Nemotron 合成数据预训练问答生成

推荐理由：NVIDIA 用任务种子生成合成数据，解决了预训练数据稀缺和多样性不足的问题，做 NLP 和模型训练的团队可以关注，能显著降低数据标注成本。

原文

10:02

pandaily@contact@pandaily.com (Pandaily)

精选76°

中国科学技术大学（USTC）研究人员开源了一种创新的智能体驱动长上下文训练范式，该范式通过智能体引导的数据生成和训练策略，显著提升了长上下文处理效率。实验表明，一个30亿参数的模型在长上下文任务上达到了与阿里巴巴Qwen3-235B模型相当的性能，而参数量仅为后者的八分之一。这一突破降低了长上下文模型训练的门槛，为资源有限的团队提供了高效方案。该范式已开源，有望推动长上下文AI应用的普及。

论文长上下文智能体开源/仓库训练范式 USTC

推荐理由：中科大用30B模型打平235B的长上下文能力，做长上下文训练的团队可以直接复用这套开源范式，省下大量算力和数据成本。

原文

6月3日

23:35

23:35IT之家（博客/媒体）

精选

中国科学院许操团队历经八年发现小肽基因 RGF，仅编码 13 个氨基酸，在正常温度下几乎不表达。该基因在低温胁迫下于花药绒毡层快速激活，通过钙离子信号调控花粉正常发育。田间试验显示，RGF 改良番茄可挽回 33.9%-52.2% 冷害产量损失，改良水稻结实率提升 10%-25%。相关成果 6 月 3 日在线发表于《自然》期刊。

论文 RGF 中国科学院 Nature 作物抗冷基因编辑

推荐理由：中科院发现抗冷害基因RGF，能保产不降产

原文

23:28

23:28IT之家（博客/媒体）

精选

中国科学院分子植物科学卓越创新中心巫永睿团队等从野生玉米中克隆出第二个高蛋白主效基因 THP3-T，成果于6月3日在线发表于《自然》。THP3-T编码谷氨酸-草酰乙酸转氨酶1，通过增强氮同化能力提升玉米籽粒及全株蛋白含量。将THP3-T与之前发现的THP9-T聚合，自交系玉米籽粒蛋白含量从10%提升至15%。导入“郑单958”后，籽粒蛋白从8.5%提升至12%-13%，产量稳定。团队已利用分子标记辅助育种技术改良80余个国内玉米主栽品种亲本，蛋白含量可提升至14%以上。

论文 THP3-T THP9-T 郑单958 高蛋白玉米野生玉米

推荐理由：野生玉米高蛋白基因克隆成功，可减少大豆进口依赖

原文

20:06

Pandaily@contact@pandaily.com (Pandaily)

华中科技大学和上海交通大学的研究团队在玻璃内部直接写入可编程三维光子神经网络，实现了光子计算的新范式。该技术利用飞秒激光在玻璃中刻写光波导和可调谐节点，构建出能在光域内执行神经网络运算的3D结构。相比传统电子芯片，光子神经网络具有低功耗、高带宽和并行处理优势，有望在人工智能推理、边缘计算等领域突破现有硬件瓶颈。这项成果展示了玻璃作为光子计算基板的潜力，为未来集成光子AI芯片提供了新路径。

论文光子计算神经网络 3D集成飞秒激光华中科技大学

推荐理由：光子计算是突破AI算力瓶颈的关键方向，做硬件加速或边缘计算的团队值得关注——玻璃内写神经网络的方法比传统硅基方案更灵活，功耗更低，建议点开了解技术细节。

原文

09:25

09:25IT之家（博客/媒体）

精选

广西医科大学第二附属医院孙煦勇团队完成人类首次原位六基因编辑猪的全肝加双肾联合异种移植。该研究使用中科奥格生物科技的广西巴马猪（3敲除+3插入）作为供体，在53岁脑死亡受体中观察约106小时。单细胞RNA测序锁定S100A12+中性粒细胞和ADGRE信号通路为早期排斥关键靶点。非靶向代谢组学检出3352种代谢物，显示猪肝能利用人体底物实现跨物种代谢重编程。研究发表于《MED》并获《Nature》专题报道，团队计划再开展3-5例验证可重复性。

论文广西医科大学孙煦勇中科奥格巴马猪异种移植六基因编辑

推荐理由：首次猪肝猪肾同时移植人体

原文

6月2日

15:17

15:17IT之家（博客/媒体）

精选

天文学家借助詹姆斯·韦布空间望远镜，在红移4.055的GN20星系中发现一个端到端约7千秒差距（约2.28万光年）的恒星棒。GN20星系诞生于宇宙大爆炸后约15亿年，是质量巨大、气体丰富的早期星系。传统理论认为恒星棒需要数十亿年才能形成，且高气体比例会抑制其生长，但GN20的发现突破了这三重理论障碍。研究由莱顿大学莱因德特·A·布加德团队领导，成果于2026年5月14日提交至arXiv。观测显示恒星形成集中在南侧与外盘交汇处以及中心区域，可能供给超大质量黑洞。

论文韦布空间望远镜 GN20 恒星棒早期星系 arXiv

推荐理由：早期星系也有恒星棒

原文

5月31日

15:56

Decoder@Jonathan Kemper

精选

哈尔滨工业大学的研究人员通过新基准测试LiveBrowseComp发现，主流AI搜索智能体（如GPT-5.4和Kimi K2.6）在标准测试中表现良好，但主要依赖训练记忆而非实时搜索。LiveBrowseComp仅询问过去90天内的事件，迫使模型无法依赖记忆。在此测试下，模型性能显著下降，现有排名被打乱。这表明AI搜索智能体存在“确认偏差”，即倾向于确认已知信息而非真正研究网络。该发现对依赖AI进行实时信息检索的用户和开发者具有重要警示意义。

论文 AI搜索智能体基准测试 GPT-5.4 Kimi K2.6

推荐理由：这项研究戳穿了AI搜索智能体的真实能力——它们更擅长背书而非真正搜索。做信息检索或依赖AI获取最新资讯的团队，看完会重新评估工具选择。

原文

11:10

11:10IT之家（博客/媒体）

精选

詹姆斯·韦布空间望远镜观测到被称为“小红点”的远古星系阿贝尔2744-QSO1，该天体存在于宇宙大爆炸后仅7亿年。研究人员首次直接测得其中超大质量黑洞质量为5000万倍太阳，占星系总质量的66%，远超邻近宇宙中黑洞与星系的质量比。这一发现表明黑洞直接诞生，早于星系形成，推翻了传统演化模型。相关成果于5月27日发表在《自然》与《皇家天文学会月报》。

论文韦布望远镜小红点黑洞早期宇宙自然期刊

推荐理由：韦布望远镜颠覆黑洞认知

原文