10:49Geek@geekbblanshu 是一个基于 Python 3.10+ 和 Pillow 库的开源绘图工具,专为技术博客、系统架构图和流程图设计。用户编辑一份 JSON 配置文件后,可同时导出 .excalidraw 源文件、高清 PNG(最高 4K)以及逐帧动画 GIF(支持 24fps)。所有渲染在本地运行,无需浏览器或远程 API 调用。视觉效果采用深色背景、手写风格标题、流动光效和脉冲高亮,类似 DailyDoseOfDS 的黑底技术手稿。项目已在 GitHub 上开源,提供 pip 快速安装。AI产品lanshuPythonPillowExcalidraw技术绘图推荐理由:技术博主画架构图常用 Excalidraw,但导出 GIF 和 PNG 还得手动转。这个工具改一份 JSON 就能同时拿到三种格式,本地渲染还快,风格也很酷。原文
00:54marktechpost@Sana Hassan精选本教程使用 Python 构建完整的 OCRmyPDF 流水线。先生成合成图像 PDF 以测试 OCR,再将其转换为可搜索 PDF 和 PDF/A 格式。通过提取侧边文本、计算单词召回率(word-recall)并比较文件大小来验证效果。还能调整 Tesseract 参数、清理噪点、纠正方向、在内存中运行 OCR 以及批量处理整个文件夹。技巧OCRmyPDFPDF/ATesseractPython文档扫描推荐理由:手把手教你用 Python 调 OCRmyPDF,从生成测试图片到批量转 PDF/A,还带召回率比较,适合文档处理需求的人。原文
20:34berryxia@berryxia精选岚叔发布了一个开源skill,先让模型将文章或架构内容压缩为结构化JSON spec,再通过本地Python + Pillow渲染出黑底手绘风格的PNG和GIF,同时输出可编辑的Excalidraw JSON。该skill可直接供agent调用,解决了复杂内容可视化效率低、观感差的问题,风格克制且便于扩展。技巧岚叔ExcalidrawPythonPillow手绘风格推荐理由:你还在手动画架构图?岚叔这个skill帮你一步生成手绘动态图,还能用Excalidraw编辑,效率拉满。原文
17:54marktechpost@Sana Hassan精选本教程演示如何用Graphify和NetworkX将多模块Python应用转为知识图谱。通过Graphify的tree-sitter解析器离线提取代码结构,生成graph.json。之后用NetworkX分析文件类型、关系类型、中心性分数、社区检测和最短路径。最终生成静态与交互式可视化,展示模块、类、函数和数据库对象的连接。技巧GraphifyNetworkXPython代码结构可视化社区检测推荐理由:想可视化你Python项目的代码结构?这个教程教你用Graphify和NetworkX离线搞定,还能找出上帝节点和社区。原文
08:27Simon Willison’s Weblog(博客/媒体)sqlite-utils 4.0rc1 是 v4 的首个候选版本,主要新功能包括数据库迁移和嵌套事务。迁移功能源自独立包 sqlite-migrate,通过 migrations.py 文件定义迁移操作,支持 Python 和命令行两种方式。嵌套事务通过 db.atomic() 上下文管理器实现,基于 SQLite savepoints,简化了嵌套事务管理。该版本包含一些向后不兼容的更改,请用户测试反馈。AI产品sqlite-utilsSQLitePython数据库迁移嵌套事务推荐理由:Simon Willison 的 sqlite-utils 4.0rc1 加了迁移和嵌套事务,适合用 SQLite 做数据管理的开发者试试。原文
07:15marktechpost@Asif Razzaq精选该指南介绍了7种智能体记忆类型:工作记忆、语义记忆、情节记忆、程序记忆、检索记忆、参数记忆和前瞻记忆。每种记忆覆盖存储内容、存储位置和构建时机。包含对比表格和可运行的Python代码示例。技巧智能体记忆系统Python工程指南推荐理由:想给自己的智能体加上记忆?这篇把7种记忆类型讲得特别清楚,还给了Python代码,直接上手复制。原文
14:55marktechpost@Sana Hassan精选本教程使用 Crawlee for Python 搭建完整的网页爬取工作流。通过 BeautifulSoupCrawler、ParselCrawler 和 PlaywrightCrawler 分别爬取静态与动态内容,提取标题、元数据和产品字段。教程还演示如何构建链接图,并将数据导出为 JSON、CSV 以及 RAG 就绪的 JSONL 分块文件。最后附带 robots 处理与截图功能,从设置到 AI 输出一步到位。技巧CrawleePythonBeautifulSoupParselPlaywright爬虫RAG推荐理由:想用 Python 从零搭一套能把网页内容直接喂给 RAG 的爬虫管道吗?这篇保姆级教程教你用 Crawlee 搞定 robots、截图和分块导出。原文
06:57marktechpost@Asif RazzaqNVIDIA AI推出了SpatialClaw,这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行,将代码作为动作接口。SpatialClaw能够组合多种感知工具,实现3D空间推理。这种设计免去了传统微调或训练步骤。AI模型SpatialClawNVIDIAPython智能体3D空间推理2 个信源在谈推荐理由:NVIDIA搞了个叫SpatialClaw的智能体,不用训练,直接用写Python代码的方式做3D空间推理,挺创新的。原文
11:28marktechpost@Sana Hassan本文使用Hugging Face加载的Salesforce CodeGen实现端到端工作流。除基础推理外,添加函数提取、语法检查、静态安全检查和单元测试验证。对最佳N个候选项进行重排序,组合多轮程序合成并实验不同提示风格。最后可视化迷你基准测试并将生成的工件导出为可复用文件。技巧Salesforce CodeGenHugging FacePython代码生成单元测试推荐理由:手把手教你用Salesforce CodeGen写Python函数,还能自动验证和重排序,适合想提升代码生成质量的开发者。原文
08:52Simon Willison’s Weblog(博客/媒体)精选Pyodide 314.0 版本发布,允许开发者将针对 Pyodide 或兼容 PyEmscripten 平台的 Python 包直接发布到 PyPI 并运行时安装。此前 Pyodide 维护者需自行维护超 300 个包,成为社区瓶颈。现在包维护者可用 cibuildwheel 构建 WASM 轮子并发布,如 luau-wasm 包(276KB)已支持在 Pyodide 中通过 micropip 安装。目前已有 28 个 PyPI 包使用该平台。AI产品PyodideWASMPyPIPythonWebAssembly推荐理由:Pyodide 终于能直接发布 WASM 包了原文
02:05Simon Willison’s Weblog(博客/媒体)精选asyncinject 0.7 是一个 Python 异步依赖注入工具库的更新版本。作者 Simon Willison 最初为支持 asyncio 的依赖注入模式而构建该库,并在 Datasette 项目中使用。Claude Fable 5 模型主动发现了库中的一些 bug 并自动修复,展示了其强大的代码审查和修复能力。该版本主要修复了依赖注入中的潜在问题,提升了稳定性。AI产品asyncinjectPython异步依赖注入Claude Fable 5代码修复10 个信源在谈推荐理由:Python 异步开发者如果用过 asyncio 依赖注入,会明白这个库的价值——Claude Fable 5 主动修 bug 的案例也值得关注,建议点开看看 AI 如何辅助代码维护。原文
11:13Geek@geekbb雪峰 Agent 是一个基于 Python 的 AI 高考志愿顾问,内置了 2600 多所高校和 792 个专业的数据。它通过多轮追问了解用户的家庭背景、分数和就业诉求,然后给出真实的择校建议。该项目已在 GitHub 开源,适合高考生和家长使用。AI产品AI 志愿顾问高考开源/仓库教育Python推荐理由:高考志愿填报是每年数百万家庭的刚需,雪峰 Agent 用 AI 把择校建议从经验驱动变成数据驱动,做教育产品开发或关心子女升学的家长值得点开看看。原文
19:13小互@imxiaohu国内团队开源了 OpenSquilla,用 Python 重写了“小龙虾”项目,解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型,对请求进行智能路由:简单任务派给便宜模型,复杂任务才用顶级模型,类似医院分诊。官方测试显示,25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash,成本从 6.2 美元降至 0.68 美元,效果几乎一致。此外,它还能根据对话语义只注入匹配度最高的 Skill,避免将所有 Skill 描述塞入上下文,100 次对话可省 100 万 Token。AI产品开源/仓库Token 优化模型路由成本控制Python推荐理由:AI 调用成本高、Token 浪费严重的团队终于有了实用解法——OpenSquilla 智能路由能省 90% 费用,做多模型编排或 Skill 密集型应用的开发者值得立刻试试。原文
08:48Simon Willison’s Weblog(博客/媒体)micropython-wasm 0.1a1 版本发布,主要修复了作者在构建 datasette-agent-micropython 时遇到的一些限制。该项目将 MicroPython 编译为 WebAssembly,可在浏览器或 Node.js 中运行 Python 代码,适用于沙箱化执行场景。新版本解决了此前版本中的兼容性问题,提升了在 WebAssembly 环境下的可用性。对于需要在 Web 端安全运行 Python 脚本的开发者来说,这是一个实用的工具。AI产品PythonWebAssembly沙箱micropython-wasm开源/仓库推荐理由:如果你需要在浏览器或 Node.js 中安全运行 Python 代码,micropython-wasm 提供了一个轻量沙箱方案,这次更新修复了关键限制,做 Web 端 Python 沙箱的开发者值得关注。原文
08:18Simon Willison’s Weblog(博客/媒体)精选Simon Willison 发布了 datasette-agent-micropython 0.1a0,旨在让 Datasette Agent 安全地生成并执行 Python 代码。该版本使用 MicroPython 在 WebAssembly 沙箱中运行代码,目前 GPT-5.5 生成的代码尚未突破沙箱限制。这个 alpha 版本看起来很有前景,为 AI 驱动的代码执行提供了更安全的隔离方案。AI产品沙箱PythondatasetteWebAssembly安全推荐理由:Datasette 用户和 AI 安全研究者值得关注——这个沙箱方案解决了 AI 生成代码的安全执行痛点,GPT-5.5 都未能逃逸,做数据分析和 AI Agent 的可以试试。原文
00:24AI Notkilleveryone@ai_zona一项关于 AI 智能体开发语言的社区调查显示,Python 凭借成熟的生态系统和研究友好性占据主导地位,TypeScript 因类型安全和生产环境优势紧随其后,Rust 则用于性能关键的基础设施。调查还包含一个幽默选项“LLM 写什么就用什么”,反映了当前 AI 辅助编程的趋势。该调查结果揭示了不同语言在 AI 智能体开发中的定位,为开发者选择技术栈提供了参考。行业AI 智能体开发语言PythonTypeScriptRust1 个信源在谈推荐理由:做 AI 智能体开发的团队可以快速了解当前社区的语言偏好和趋势,帮助你在 Python 的灵活性和 TypeScript 的生产力之间做出更明智的选择。原文
11:35arXiv cs.AI@Peng Ding, Rick Stevens精选一项实证研究通过zerodep项目,用LLM辅助开发了40多个仅依赖Python标准库的模块,替代流行的第三方库。基准测试显示,大多数情况下stdlib实现性能与第三方库持平(2倍以内),但在C扩展支持的计算任务(如图像处理、二进制序列化)中性能差距明显。有趣的是,许多第三方库因架构开销反而比stdlib实现慢5-115倍。该研究揭示了stdlib的能力边界,并探讨了LLM在严格约束下生成正确、高效代码的可行性。论文Python标准库第三方库LLM辅助开发性能基准推荐理由:Python开发者面临依赖管理痛点,这项研究用数据告诉你哪些第三方库可以用stdlib替代,哪些不行。做轻量级部署或减少供应链风险的团队,值得参考zerodep的实践。原文
11:15arXiv cs.AI@Mohamed Almukhtar, Anwar Ghammam, Hua Ming精选一项针对 AI 代理生成的 Python 重构 Pull Request 的实证研究发现,平均 22.5% 的变更提升了代码质量属性,其中可用性提升最频繁(36.5%)。但 24.17% 的修改文件引入了新的 Pylint 问题(主要是约定违规如长行),4.7% 引入了新的 Bandit 安全发现。尽管存在这些问题,73.5% 的 PR 被合并,包括那些引入新问题但同时也移除了旧问题的案例。研究还归纳了 24 种常见变更操作及其与 lint/安全发现的关系,强调了在 AI 驱动开发中加强质量与安全门控的必要性。论文AI 编程代码质量安全重构Python推荐理由:AI 写代码到底靠不靠谱?这篇论文用数据说话——重构 PR 质量有提升也有隐患,做 AI 编程工具或代码审查的团队值得看看,能帮你设计更好的质量门控。原文
01:29AlphaSignal@AlphaSignalAIAdala 是一个开源框架,利用自主智能体自动完成数据标注,取代传统的手工标注方式。用户只需提供少量标注示例作为环境,智能体通过观察、反思和迭代学习技能,自动生成高质量标注。每个技能运行在语言模型运行时中,支持不同模型切换,实现学生-教师模式以降低推理成本。框架支持严格或灵活的输出格式,并可直接集成到 Python 笔记本中处理大规模数据。AI产品开源/仓库智能体数据标注Python学生-教师模型推荐理由:数据标注团队和机器学习工程师终于能摆脱重复劳动——Adala 用自主智能体自动学习标注技能,大幅缩短项目周期,建议做数据预处理或模型训练的团队直接试试。原文
22:17Together AI@togethercomputeTogether AI 推理高级总监 Yineng Zhang 将于 5 月 16 日在 PyCon US 发表演讲,主题为生产环境中 LLM 推理的实战经验。他将讲解 Python 在推理运行时优化中的实际作用、真实部署中遇到的挑战及解决方案,以及大规模推理引擎的新设计方向。该演讲定于美国时间 5 月 16 日 17:00-17:30 在 Grand Ballroom A 举行,适合正在优化推理性能的从业者关注。行业LLM推理生产部署PythonTogether AIPyCon推荐理由:该演讲聚焦于真实部署中的推理优化和引擎设计,对于从事 LLM 服务化、推理加速的工程师和架构师具有直接参考价值。原文