AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:翻译×
6月27日
22:45
22:45Runway ML@runwayml
Runway 在 API 中推出了 Localize ads Recipe,支持通过单一 API 调用翻译静态广告和图形资产。用户只需输入一张广告图像,即可获得任意语言版本的输出。该功能旨在简化多市场广告素材的本地化流程,无需手动重新设计。目前该功能已可通过 Runway API 使用。
AI产品RunwayAPI广告本地化多语言翻译

推荐理由:Runway 新出的本地化广告功能,一张图像丢进去,API 直接吐出多语言版本,省去挨个翻译的麻烦。
原文
6月18日
15:01
15:01IT之家(博客/媒体)
科大讯飞旗下讯飞 AI 眼镜在京东开启首销,定价 4299 元,重量仅 40 克。该眼镜搭载端到端语音同传大模型,支持 122 种语言(含方言、口音)翻译,覆盖 200 多个国家和地区,提供通话翻译、同声传译、面对面翻译等六大场景。还内置 GlassClaw AI 助理,支持多端任务接力,以及实时提词和自动纪要功能。
AI产品科大讯飞讯飞AI眼镜GlassClaw智能穿戴翻译

推荐理由:讯飞出了款40克AI眼镜,能翻译122种语言,开会、出国旅游戴上就能实时翻译,4299元比想象的轻便,推荐给经常跨国沟通的人。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月8日
21:13
21:13小互@imxiaohu
精选
该开源工具支持下载、转写、翻译、润色、烧录一条龙操作,用户只需一句话即可为任意语言视频添加任意语言字幕。项目链接指向GitHub仓库xiaohuailabs,提供完整功能。无具体版本号或基准数据。
AI产品xiaohuailabs开源工具字幕生成视频处理翻译

推荐理由:给视频自动加字幕
原文
6月2日
12:04
12:04arXiv cs.AI@Deokhyung Kang, Hyounghun Kim, Gary Geunbae Lee
推理语言模型在复杂推理任务上表现优异,但在非英语输入上仍存在多语言推理差距,主要原因是语言理解失败。英语翻译可以缓解这一问题,但并非所有输入都需要翻译。为此,研究者提出 Luar(语言理解边界感知强化学习框架),训练模型在直接理解不可靠时选择性调用翻译。在多项多语言推理基准测试中,Luar 优于标准 GRPO 等方法,尤其在低资源语言上提升显著。该框架能避免不必要的翻译,并泛化到未见过的低资源语言。项目代码已开源。
论文推理模型多语言强化学习翻译开源/仓库

推荐理由:多语言推理场景下,翻译不是越多越好——Luar 教会模型在「不懂的时候才翻」,做多语言 NLP 或低资源语言应用的团队可以直接用这个框架来提升推理效率。
原文
5月18日
12:22
12:22Marc Andreessen@pmarca
一位用户分享父亲在祖父去世后,用ChatGPT将祖父留下的德文旧文档翻译成英文,保留了原文的语气和历史背景。相比过去使用Google Translate的直译效果差、难以理解,ChatGPT的翻译让父亲能即时与祖母分享故事,并在悲伤中更深入了解祖父的人生。这个故事展示了AI在情感和人文关怀场景中的实际价值,而不仅仅是技术参数。
AI产品ChatGPT翻译情感应用家庭故事AI人文

推荐理由:AI不只是生产力工具,还能在家庭情感场景中发挥独特价值——如果你曾因语言障碍错过亲人故事,这个故事会让你重新思考AI的意义。
原文
5月16日
23:53
23:53Geek@geekbb
AirTranslate 是一款新工具,能捕获 Mac 上播放的任何系统音频(包括会议、讲座、视频、直播),实时转录为文字并翻译到目标语言。它解决了跨语言实时理解音频内容的痛点,无需额外麦克风或软件。该工具已在 GitHub 开源,适合需要实时翻译会议或讲座内容的用户。目前该项目获得较多关注,有 197 个点赞和 39 次转发。
AI产品实时转录翻译Mac开源/仓库会议工具

推荐理由:做跨国会议、听外语讲座或追直播的 Mac 用户,终于不用对着屏幕手动翻译了——AirTranslate 直接抓系统音频实时转文字翻译,建议试试这个开源方案。
原文
5月14日
13:27
13:27arXiv cs.AI@Ziheng Zhang, Yunzhong Hou, Naijing Liu, Liang Zheng
精选
WARDEN 是一个针对极度低资源场景设计的语言模型系统,能够将澳大利亚濒危原住民语言 Wardaman 转录并翻译成英语。由于仅有6小时标注音频数据,传统的大规模端到端方法不可行,因此 WARDEN 采用两阶段架构:先进行音素转录,再翻译成英文。研究提出了两项关键技术:从与 Wardaman 音素相似的 Sundanese 语初始化转录模型,以及利用专家标注的 Wardaman-英语词典增强大语言模型的翻译推理。实验表明,在极低数据条件下,两阶段设计优于统一模型,WARDEN 仅用6小时数据即超越更大规模的开源和商业模型。代码与数据已开源。
论文低资源语言语音转录翻译WARDEN濒危语言

推荐理由:低资源语言处理是 NLP 的硬骨头,WARDEN 用两阶段设计+跨语言迁移+词典增强给出了可行方案,做低资源 ASR/NMT 的研究者可以直接参考其技术路线。
原文
精选全部日报登录