AITOP6月11日 15:28
精选
过去 24 小时,从 904 条中筛出 50 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月9日
10:36
10:36
arXiv cs.AI@Anastasiia Kuvshinova, Seungmin Jin
精选
推荐理由:Kubernetes运维团队终于有了一个可审计的根因分析方案——Graph Traversal Agent通过图约束和独立验证,避免了LLM常见的幻觉和场景作弊。做K8s可观测性或事件诊断的开发者,值得看看这个结合图遍历与LLM的框架设计。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月28日
08:47
08:47
NVIDIA AI@NVIDIAAI
精选72°
推荐理由:Kubernetes 上跑推理的团队终于不用忍受 GPU 空转几分钟了——Dynamo Snapshot 把冷启动压到 5 秒,做弹性扩缩容的 MLOps 工程师可以直接拿来用。
5月27日
11:02
11:02
LangChain@LangChainAI
精选
推荐理由:自托管 LangSmith 的团队终于有了一个轻量运维方案——Mission Control 省去了 ingress 和外部控制平面,直接在 K8s 内搞定部署和监控,做 LLM 应用基础设施的开发者值得关注。
5月26日
12:36
12:36
arXiv: DeepSeek@Andrey Kozachok, Anatoliy Bakaev, Aleksandr Kozachok, Shamil Magomedov, Artem Noev
精选
推荐理由:K8s 运维和平台工程团队终于有了一个轻量级方案来生成 YAML 清单——1.5B 模型就能跑出 91.5% 的通过率,做基础设施自动化的开发者可以直接参考其数据蒸馏思路。
