AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 360 条中筛出 13 条
全部模型产品行业论文技巧
标签:结构化数据×
6月16日
00:40
00:40Jerry Liu@jerryjliu0
精选
LlamaIndex在LlamaParse中新增Extract功能,解决企业合同非标准模板、跨章节引用及修订条款等语义解析难题。该功能通过保留文档层次结构、语义推理关键字段(如付款条款、续约日期),将合同从纯文本转化为验证后的模式对齐输出。相比传统OCR仅做数字化,Extract实现了高精度且成本可控的合同理解,避免在每页使用Fable/Opus等昂贵模型。结果可直接供下游生产系统使用,支持批量合同处理场景。
AI产品LlamaIndexLlamaParse合同提取结构化数据企业AI

推荐理由:LlamaIndex新出Extract,能把杂乱的合同PDF自动变成结构化数据,解析条款和修订不再头疼,企业合同管理直接省下人工翻找的功夫。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
00:20
00:20a16z@a16z
精选
a16z GP David Haber 指出,大多数工作对话正被默认记录,未来你在工作中说的每一句话都可能被录下。他认为,当前企业系统的核心是结构化数据(如CRM、工单、文档),但最高价值的信息其实存在于非结构化的对话中——客户电话的细节、产品评审的真实争论、领导会议中改变路线图的随口评论。LLM 擅长将这些语音数据转化为可搜索、可查询的结构化信息,这催生了一个围绕语音而非文本的企业软件新类别。Haber 认为这是一个巨大的企业机会,但软件层形态和归属权仍在早期探索阶段。
行业企业软件语音数据LLMa16z结构化数据

推荐理由:a16z 点出了企业软件的下一个战场——语音数据,做 SaaS 或企业工具的团队值得关注这个趋势,提前布局语音分析能力。
原文
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月18日
12:07
12:07arXiv cs.AI@Arquimedes Canedo
精选
论文提出了一种名为paper.json的轻量级JSON文件约定,旨在解决LLM智能体阅读学术论文时的常见问题,如子声明无法细粒度引用、范围过度扩展、图表命令隐藏在代码库中。该约定包含五个核心约定:稳定声明ID(C1)、明确的不声明列表(C2)、精确的每图shell命令(C3)、稳定定义ID(C5),以及最低可行合规性(C4)。作者声称,为已完成的论文手动编写符合规范的JSON文件可在1小时内完成。论文本身已实现合规,并通过了验证测试。该工作开源在GitHub上,为AI驱动的论文阅读和自动化提供了标准化接口。
论文LLM智能体论文阅读结构化数据开源/仓库学术自动化

推荐理由:做AI论文阅读工具或学术自动化智能体的开发者,这个约定能解决子声明引用和范围误判的痛点,值得直接参考或贡献。
原文
精选全部日报登录