07:12Jerry Liu@jerryjliu0LlamaIndex 在 LlamaParse 中推出了细粒度边界框功能,能够为文档中的每个单词、行和表格单元格提供精确的视觉坐标。这使得 AI 代理在提取信息时,可以追溯到文档中的具体位置,而不仅仅是段落或页面。该功能专为审计、合规审查和需要验证的 AI 工作流设计,解决了知识工作自动化中决策可审计性的关键痛点。用户现在可以在 cloud.llamaindex.ai 上体验。AI产品LlamaParse文档解析审计溯源合规边界框推荐理由:做文档解析、合规审计或金融分析的团队终于有了可验证的溯源方案——LlamaParse 的逐词边界框让 AI 提取的每个数字都能精确定位到原文,审计流程不再靠‘大概在这页’糊弄,建议直接试用。原文
10:54小互@imxiaohu78°Ideogram 发布了首个开源 AI 图像模型 Ideogram 4.0,宣称在文字渲染和版面控制上达到了开源领域的新高度。该模型引入了边界框(bounding box)控制,允许用户用坐标精确指定每个元素在画面中的位置。同时,它支持结构化 JSON 提示词,不再局限于纯文本 prompt。在文字渲染方面,英文 OCR 准确率达到 0.97(X-Omni 基准测试),并支持中日韩等非拉丁文字的密集渲染。这一发布大幅降低了高质量可控图像生成的门槛,对设计师和开发者意义重大。AI模型Ideogram 4.0开源图像模型文字渲染版面控制边界框5 个信源在谈推荐理由:做设计或内容生成的团队终于有了开源可控的图像模型——边界框和 JSON 提示词让排版和布局不再靠运气,建议直接上手试试。原文