AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:Python×
6月29日
00:54
00:54marktechpost@Sana Hassan
精选
本教程使用 Python 构建完整的 OCRmyPDF 流水线。先生成合成图像 PDF 以测试 OCR,再将其转换为可搜索 PDF 和 PDF/A 格式。通过提取侧边文本、计算单词召回率(word-recall)并比较文件大小来验证效果。还能调整 Tesseract 参数、清理噪点、纠正方向、在内存中运行 OCR 以及批量处理整个文件夹。
技巧OCRmyPDFPDF/ATesseractPython文档扫描

推荐理由:手把手教你用 Python 调 OCRmyPDF,从生成测试图片到批量转 PDF/A,还带召回率比较,适合文档处理需求的人。
原文
6月24日
17:54
17:54marktechpost@Sana Hassan
精选
本教程演示如何用Graphify和NetworkX将多模块Python应用转为知识图谱。通过Graphify的tree-sitter解析器离线提取代码结构,生成graph.json。之后用NetworkX分析文件类型、关系类型、中心性分数、社区检测和最短路径。最终生成静态与交互式可视化,展示模块、类、函数和数据库对象的连接。
技巧GraphifyNetworkXPython代码结构可视化社区检测

推荐理由:想可视化你Python项目的代码结构?这个教程教你用Graphify和NetworkX离线搞定,还能找出上帝节点和社区。
原文
6月22日
08:27
08:27Simon Willison’s Weblog(博客/媒体)
sqlite-utils 4.0rc1 是 v4 的首个候选版本,主要新功能包括数据库迁移和嵌套事务。迁移功能源自独立包 sqlite-migrate,通过 migrations.py 文件定义迁移操作,支持 Python 和命令行两种方式。嵌套事务通过 db.atomic() 上下文管理器实现,基于 SQLite savepoints,简化了嵌套事务管理。该版本包含一些向后不兼容的更改,请用户测试反馈。
AI产品sqlite-utilsSQLitePython数据库迁移嵌套事务

推荐理由:Simon Willison 的 sqlite-utils 4.0rc1 加了迁移和嵌套事务,适合用 SQLite 做数据管理的开发者试试。
原文
07:15
07:15marktechpost@Asif Razzaq
精选
该指南介绍了7种智能体记忆类型:工作记忆、语义记忆、情节记忆、程序记忆、检索记忆、参数记忆和前瞻记忆。每种记忆覆盖存储内容、存储位置和构建时机。包含对比表格和可运行的Python代码示例。
技巧智能体记忆系统Python工程指南

推荐理由:想给自己的智能体加上记忆?这篇把7种记忆类型讲得特别清楚,还给了Python代码,直接上手复制。
原文
6月21日
14:55
14:55marktechpost@Sana Hassan
精选
本教程使用 Crawlee for Python 搭建完整的网页爬取工作流。通过 BeautifulSoupCrawler、ParselCrawler 和 PlaywrightCrawler 分别爬取静态与动态内容,提取标题、元数据和产品字段。教程还演示如何构建链接图,并将数据导出为 JSON、CSV 以及 RAG 就绪的 JSONL 分块文件。最后附带 robots 处理与截图功能,从设置到 AI 输出一步到位。
技巧CrawleePythonBeautifulSoupParselPlaywright爬虫RAG

推荐理由:想用 Python 从零搭一套能把网页内容直接喂给 RAG 的爬虫管道吗?这篇保姆级教程教你用 Crawlee 搞定 robots、截图和分块导出。
原文
6月20日
06:57
06:57marktechpost@Asif Razzaq
NVIDIA AI推出了SpatialClaw,这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行,将代码作为动作接口。SpatialClaw能够组合多种感知工具,实现3D空间推理。这种设计免去了传统微调或训练步骤。
AI模型SpatialClawNVIDIAPython智能体3D空间推理

推荐理由:NVIDIA搞了个叫SpatialClaw的智能体,不用训练,直接用写Python代码的方式做3D空间推理,挺创新的。
原文
6月19日
11:28
11:28marktechpost@Sana Hassan
本文使用Hugging Face加载的Salesforce CodeGen实现端到端工作流。除基础推理外,添加函数提取、语法检查、静态安全检查和单元测试验证。对最佳N个候选项进行重排序,组合多轮程序合成并实验不同提示风格。最后可视化迷你基准测试并将生成的工件导出为可复用文件。
技巧Salesforce CodeGenHugging FacePython代码生成单元测试

推荐理由:手把手教你用Salesforce CodeGen写Python函数,还能自动验证和重排序,适合想提升代码生成质量的开发者。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月14日
08:52
08:52Simon Willison’s Weblog(博客/媒体)
精选
Pyodide 314.0 版本发布,允许开发者将针对 Pyodide 或兼容 PyEmscripten 平台的 Python 包直接发布到 PyPI 并运行时安装。此前 Pyodide 维护者需自行维护超 300 个包,成为社区瓶颈。现在包维护者可用 cibuildwheel 构建 WASM 轮子并发布,如 luau-wasm 包(276KB)已支持在 Pyodide 中通过 micropip 安装。目前已有 28 个 PyPI 包使用该平台。
AI产品PyodideWASMPyPIPythonWebAssembly

推荐理由:Pyodide 终于能直接发布 WASM 包了
原文
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
02:05
02:05Simon Willison’s Weblog(博客/媒体)
精选
asyncinject 0.7 是一个 Python 异步依赖注入工具库的更新版本。作者 Simon Willison 最初为支持 asyncio 的依赖注入模式而构建该库,并在 Datasette 项目中使用。Claude Fable 5 模型主动发现了库中的一些 bug 并自动修复,展示了其强大的代码审查和修复能力。该版本主要修复了依赖注入中的潜在问题,提升了稳定性。
AI产品asyncinjectPython异步依赖注入Claude Fable 5代码修复

推荐理由:Python 异步开发者如果用过 asyncio 依赖注入,会明白这个库的价值——Claude Fable 5 主动修 bug 的案例也值得关注,建议点开看看 AI 如何辅助代码维护。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月3日
08:48
08:48Simon Willison’s Weblog(博客/媒体)
micropython-wasm 0.1a1 版本发布,主要修复了作者在构建 datasette-agent-micropython 时遇到的一些限制。该项目将 MicroPython 编译为 WebAssembly,可在浏览器或 Node.js 中运行 Python 代码,适用于沙箱化执行场景。新版本解决了此前版本中的兼容性问题,提升了在 WebAssembly 环境下的可用性。对于需要在 Web 端安全运行 Python 脚本的开发者来说,这是一个实用的工具。
AI产品PythonWebAssembly沙箱micropython-wasm开源/仓库

推荐理由:如果你需要在浏览器或 Node.js 中安全运行 Python 代码,micropython-wasm 提供了一个轻量沙箱方案,这次更新修复了关键限制,做 Web 端 Python 沙箱的开发者值得关注。
原文
08:18
08:18Simon Willison’s Weblog(博客/媒体)
精选
Simon Willison 发布了 datasette-agent-micropython 0.1a0,旨在让 Datasette Agent 安全地生成并执行 Python 代码。该版本使用 MicroPython 在 WebAssembly 沙箱中运行代码,目前 GPT-5.5 生成的代码尚未突破沙箱限制。这个 alpha 版本看起来很有前景,为 AI 驱动的代码执行提供了更安全的隔离方案。
AI产品沙箱PythondatasetteWebAssembly安全

推荐理由:Datasette 用户和 AI 安全研究者值得关注——这个沙箱方案解决了 AI 生成代码的安全执行痛点,GPT-5.5 都未能逃逸,做数据分析和 AI Agent 的可以试试。
原文
精选全部日报登录