AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:PDF提取×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月31日
09:07
09:07shao__meng@shao__meng
精选
LandingAI 黑客松项目 ArthaNethra 展示了从 PDF 到可查询、可溯源、可推理的金融知识图谱的完整流程。系统通过上传、ADE 提取、归一化、双库索引和风险检测五个步骤,将发票、贷款合同、10-K 等文档转化为结构化知识。知识图谱包含 10 类实体和 26 种规范关系,并利用 Weaviate 和 Neo4j 双库分别支持语义搜索和多跳遍历。每条实体和关系都带有文档、页码、章节等引用元数据,确保可溯源。该项目为金融文档的智能分析提供了实用参考。
AI产品知识图谱金融PDF提取LandingAI双库索引

推荐理由:金融从业者或知识图谱开发者可以借鉴这套从 PDF 到可查询图谱的完整 pipeline,特别是双库架构和同义词归一化设计,直接用于合同审查、风险检测等场景。
原文
5月18日
11:43
11:43Jerry Liu@jerryjliu0
精选
LlamaIndex 团队在 AI Engineer Singapore 大会上举办了一场 90 分钟的工作坊,主题是如何在企业文档上构建智能体工作流。主讲人 @hexapode 重点讲解了如何从 PDF 等非结构化文档中提取信息,并将其整合为确定性的智能体工作流。团队表示将很快分享幻灯片,并预告在旧金山世界博览会上会有更多精彩内容。
AI产品智能体企业文档LlamaIndexPDF提取工作流

推荐理由:企业文档中大量非结构化数据被浪费,这个工作坊直接给出了从 PDF 提取信息到构建确定性智能体工作流的完整方案,做企业知识管理或文档自动化的开发者值得关注。
原文
精选全部日报登录