翻译 - WWW.AWTEY.CN - WWW.AWTEY.CN

腾讯混元开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit，仅 440MB

www.ithome.com · 2026-04-29 16:51:53+08:00 · tech

IT之家 4 月 29 日消息，今日腾讯混元宣布开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit，把支持 33 种语言的翻译大模型压缩至 440MB，无需联网，下载即可直接在手机本地运行，“翻译质量优于谷歌翻译”。演示设备：高通骁龙 865，8GB 内存 IT之家附官方详细介绍如下：基于混元翻译大模型 Hy-MT1.5 打造，翻译效果比肩商用翻译模型 Hy-MT1.5 是腾讯混元团队打造的专业翻译大模型，原生支持 33 种语言、5 种方言 / 民汉及 1056 个翻译方向。从常见的中英互译，到法语、日语、阿拉伯语、俄语，甚至藏语、蒙古语等少数民族语言，它都能游刃有余地处理。仅以 1.8B 参数量，Hy-MT1.5 实现了比肩商业翻译 API 和 235B 级大模型的翻译效果。在严格的评测基准中，其翻译质量不仅超越了谷歌翻译等主流系统，更证明了在高效优化下，轻量级模型能够迸发出令人印象深刻的翻译能力。 Hy-MT1.5-1.8B 翻译效果评分，详情见文末链接「Hy-MT1.5 技术报告」但问题来了：原始的 1.8B 模型即使在 FP16 精度下，依然占用 3.3GB 内存。对于手机上金子般的内存来说，依然太大、太慢，所以需要量化压缩。最极致的量化压缩，把模型装进手机量化压缩，简单来说就是：把模型里原本用 16 位数字 (16-bit) 表示的参数转用更低位数字储存。这就像把一幅高清照片压缩成缩略图，文件小了很多，但你还是能看清楚里面的内容。针对不同的手机用户，腾讯特别推出了 2-bit 与 1.25-bit 两种极致的量化压缩方案。不同大小的模型在 FLORES-200 中外互译的效果评分 2-bit 模型：性能与质量的平衡（适用：中高端机型） 2-bit 模型采用了业内顶尖的拉伸弹性量化（SEQ），将模型参数量化至 {-1.5，-0.5，0.5，1.5}，并结合量化感知蒸馏，在将模型体积压缩至 574MB 的同时，实现了几乎无损的翻译质量，效果超越上百 GB 的大模型。在支持 Arm SME2 技术的移动设备上，2-bit 模型能够实现更快速、更高效的推理。 2-bit 模型在 SME2 及 Neon 内核的速度对比演示 1.25-bit 模型：Sherry 极致压缩（适用：全系机型）为了达成极致的轻量化，腾讯推出了基于 Sherry（稀疏高效三值量化）技术的 1.25-bit 模型。该技术方案已经被 NLP 顶级学术会议 ACL 2026 录用。链接： https://arxiv.org/ abs/2601.07892 Sherry 压缩方案的核心逻辑在于“细粒度稀疏”策略：每 4 个模型参数，3 个最重要的用 1-bit 储存，1 个用 0 储存，平均每个参数仅需 1.25-bit。配合腾讯专门为手机 CPU 设计的 STQ 内核，该方案实现了对 SIMD 指令集的完美适配。最终，3.3GB 的原始模型被进一步压缩至 440MB，轻松常驻后台，让内存紧张的普通手机也能顺滑进行高质量离线翻译。 FP16 (八倍速)vs.1.25bit 速度对比，演示设备：高通骁龙 888，8GB 内存实际体验：全离线、零成本、零隐私暴露本次开源不仅包含模型权重，我们还特别制作了一个实际可用的腾讯混元翻译 Demo 版，特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页，混元翻译都能随叫随到。无需网络，无需订阅，完全本地处理、不涉及个人信息的采集和上传，一次下载永久使用！演示设备：高通骁龙 7+gen2，16GB 内存立即体验所有的模型权重、代码及技术报告均已全面开源。（暂时只支持安卓体验 demo，后续正式版会添加对 IOS 等平台的支持。）体验链接： Huggingface（海外用户）：: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF / resolve / main / Hy-MT-demo.apk 魔搭社区（国内用户）： https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF / resolve / master / Hy-MT-demo.apk 模型下载 1、Huggingface（海外用户）： 2-bit 模型权重： https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-2bit 2-bit 模型 gguf： https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-2bit-GGUF 1.25-bit 模型权重： https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit 1.25-bit 模型 gguf： https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF 2、魔搭社区（国内用户）： 2-bit 模型权重： https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-2bit 2-bit 模型 gguf： https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-2bit-GGUF 1.25-bit 模型权重： https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit 1.25-bit 模型 gguf： https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF 3、技术报告： Sherry 论文地址： https://arxiv.org/ abs/2601.07892 AngelSlim 技术报告： https://arxiv.org/ abs/2602.21233 Hy-MT1.5 技术报告： https://arxiv.org/ abs/2512.24092 4、代码仓库： AngelSlim: https://github.com/tencent/AngelSlim

谷歌翻译 20 周年：最常见短语为“谢谢”，新增发音练习功能

www.ithome.com · 2026-04-29 11:07:16+08:00 · tech

IT之家 4 月 29 日消息，当地时间 4 月 28 日，谷歌翻译官方宣布迎来 20 周年，目前已支持近 250 种语言和逾 6 万个语言对（翻译等跨语言活动中涉及的两种语言的组合），覆盖全球约 95% 人口。谷歌官方同时宣布推出发音练习功能，让用户可以在安卓版翻译应用上精进表达。该工具利用 AI 分析用户的语音并提供即时反馈，帮助用户在开始现实对话之前掌握正确的发音。该功能目前已在美国和印度上线，支持英语、西班牙语和印地语。 IT之家注意到，谷歌官方还分享了一组数据，本月正如过去 20 年里的许多月份一样，谷歌翻译上最常用的短语不是商业术语或技术咨询，而是简单的：“Thank you（谢谢）” ，以下是本月其他一些热门的翻译查询： How are you？（你好吗？） I love you（我爱你） Hello（你好） Please（请）

火狐 Firefox 浏览器 150 发布：增强分屏视图、优化 PDF 阅读器、新增实时隐私翻译

www.ithome.com · 2026-04-21 08:24:34+08:00 · tech

IT之家 4 月 21 日消息，Mozilla 昨日发布火狐 Firefox 浏览器 150 稳定版，分屏视图支持右键直接打开链接，PDF 编辑器新增页面排序与导出功能，标签页分享支持批量操作。分屏视图新增右键菜单选项，用户可直接在分屏中打开链接，并支持搜索已打开标签页及快速反转标签（Reverse Tabs）位置。新版增强内置 PDF 编辑器功能，用户无需依赖第三方工具，现可对 PDF 文件执行重新排序、复制、粘贴、删除及导出操作。新版优化标签页管理与分享功能，用户可一次性选中多个标签页，通过右键菜单批量分享链接，粘贴至其他应用后会自动包含页面标题与网址。安全方面，新版 Firefox 扩展本地网络访问限制（此前该功能仅限于开启严格追踪保护的用户）至所有用户，网站必须获得用户授权后，才能连接本地设备或服务。翻译功能方面，桌面版 Firefox 新增实时隐私翻译页面，用户在地址栏输入“about:translations”即可快速访问，为保护用户隐私，整个翻译过程在本地完成。系统集成方面，Linux 平台新增支持 GTK 表情选择器，并通过 .rpm 安装包适配 Red Hat、Fedora 等发行版，Windows 商店版用户现可使用 Web 应用功能。图源：phoronix 新版全面升级配置文件管理系统，Windows 10 与 Windows 11 用户可备份配置文件为本地文件，方便数据迁移与恢复。 IT之家附上参考地址火狐 Firefox 浏览器 150 稳定版下载地址

DeepL 推出实时语音翻译功能，支持语言对语音通话

www.ithome.com · 2026-04-16 20:50:56+08:00 · tech

IT之家 4 月 16 日消息，此前专注于文字内容的语言人工智能企业 DeepL 德国当地时间今日宣布推出专为实时口语交流设计的实时翻译产品套件 DeepL Voice-to-Voice。 DeepL Voice-to-Voice 套件包括 Voice for Meetings 会议实时翻译、跨平台的 Voice for Conversations、跨语言群组对话、API、专门化自定义等一系列功能，部分将在未来正式推出。在 DeepL 委托 Slator 独立进行的盲测中， 96% 的语言学家更青睐 DeepL Voice 而非谷歌、微软、Zoom 提供的原生翻译解决方案。 DeepL 创始人兼首席执行官 Jarek Kutylowski 表示：今天，我们在翻译领域又迈出了新的一步：实时口语交流。我们的使命一直是打破语言障碍，而如今，我们已成功攻克了其中最难的一道。 DeepL Voice-to-Voice 语音通话功能让每个人都能用自己的语言自然交流，无需面对翻译带来的障碍或成本。我们将世界一流的语音模型与我们不断推向新高度的业界标杆级翻译人工智能相结合。现在，专业能力才是关键，语言并不重要。

腾讯开源手机端离线翻译模型

36kr.com · None · tech

36氪获悉，4月29日，腾讯混元推出并开源极致量化压缩版本翻译模型Hy-MT1.5-1.8B-1.25bit，把支持33种语言的翻译大模型压缩至440MB，无需联网，下载即可直接在手机本地运行。

PettiChat获百万美元种子投资，造出宠物穿戴AI翻译器

36kr.com · None · tech

36氪获悉，宠物AI科技初创公司PettiChat于近期完成100万美元的种子轮融资。由浙大校友基金藕舫天使与华旦天使联合投资，本轮融资将主要用于动物行为世界模型的研发、高质量数据集的构建以及首款硬件产品的市场推广。在通用人工智能（AGI）横扫人类语言世界的今天，一个被忽视的语言场景被一家初创企业投入了密切关注——那就是人类与动物之间的沟通。长期以来，人类与宠物的互动多停留在感性猜测层面。虽然宠物市场规模巨大——据统计，2025年全球宠物市场规模预计将达到2700亿美元，且复合增长率达6.45%——但在“理解宠物真实需求”这一核心痛点上，市场仍缺乏解决方案。 PettiChat则试图通过构建“动物行为世界模型（Animal Behavior World Model）”，打破人宠之间的物种交流隔阂。佩戴翻译器的猫从“翻译官”到“世界模型” 不同于市面上简单的、基于娱乐性的宠物翻译软件，Pettichat的核心底层逻辑是“行为与语言的双重建模”。PettiChat认为动物的行为具有可预测的“Token”。人类拥有约860亿个神经元，而狗和猫分别拥有5.3亿和2.27亿个神经元，宠物的神经元数量远少于人类，所以它们的行为模式在物理规律和生物本能也下更具规律性。 PettiChat的核心产品架构包含三大维度： 1、 PET VOICE TRANSLATION（宠物语音翻译）： 2、PET TALK CONVERSATION（宠物对话）：基于AI Agent技术，让人类的意图以声音的方式传达给宠物，实现人的语言转达为宠物的语言。 3、LOCATION & HEALTH TRACKER（位置与健康追踪）：通过穿戴设备收集多模态数据，实现行为预警与健康管理。 “我们想做的不仅仅是一个翻译器，而是动物的行为世界模型。”PettiChat创始人李景元表示，“人类已经有了语言大模型，以及基于多模态数据的世界模型。我们希望构建出动物的一套包含视觉，声音，生化信号，行为信号等的的世界模型。通过收集高质量的动物行为数据，我们可以利用更合理的物理建模架构，去预测宠物的健康和行为。” PettiChat目前推出的核心产品是一款重约27.2g的智能宠物可穿戴设备，定位为宠物界的“AI智能硬件”。该产品具备IP56级防水，采用磁吸充电，通过夹在项圈上即可便捷佩戴。主人通过配套App可实现与宠物的实时对话：当宠物发出叫声时，设备会自动录音并进行实时翻译；主人亦可通过App发送指令，由设备将其转换成宠物语言传达给宠物，从而实现人宠之间的双向沟通。宠物语言模型 AI时代的“宠物语料库” 在AI竞争的下半场，数据的质量决定了模型的上限。PettiChat团队意识到，过去宠物识别领域之所以没有突破，是因为缺乏针对性、高质量且经过标注的动物行为数据集。为此，PettiChat正在持续构建一套庞大的动物行为数据库，涵盖了从日常互动声音、肢体语言到异常生理状态的不同维度数据，经过专家审核的数据目前猫类数据有约89万条，犬类有约 65万条数据。通过这些“物理世界”的数据喂养，模型能够实现从“识别”到“预测”的跨越，根据PettiChat提供的数据，猫的情境声学模式测试准确率达到了94.6%，狗的准确率达到了92.3%。同时，系统也基于AI Agent加强了动作识别和动物行为学的上下文理解能力，能更好的结合最近的互动，预判宠物的行为异常与焦虑表现等。商业化落地：软硬结合的多维矩阵在商业路径上，PettiChat选择了“硬件载体+订阅服务”的模式。其首款实时宠物翻译器已展开预售，产品在海外预售价为129美元，国内预售价为799元人民币。除了C端的宠物伴侣市场，PettiChat的技术愿景还指向了更广阔的B端领域。由于其底层逻辑是建立物理世界的动物模型，该技术未来可延伸至畜牧业、野生动物保护等场景，通过监控动物的行为和情绪，提高养殖效率或实现生态预警。目前，全球宠物配件市场规模已达585亿美元，其中可穿戴设备和智能硬件是增长非常快的细分赛道。PettiChat凭借其独创的“世界模型”理念，正试图在这一碎片化严重的市场中，建立起基于技术深度的品牌护城河。团队核心成员均来自浙江大学计算机学院与人工智能学院。创始人李景元，浙江大学人工智能博士，是一位90后连续创业者；CTO杜稼淳拥有浙江大学学士及荷兰埃因霍温理工大学硕士学位，在阿里云拥有物联网和大模型领域8年工作经验。投资人观点： @ 华旦天使投资宠物经济是具有巨大潜力的新兴市场，AI最近的发展又使得宠物主与宠物的互动可以更加多样化趣味化。华旦天使投资作为投资过许多浙大优秀团队的早期科创投资机构，也很开心可以在这次的投资中支持同样来自于竺可桢学院强化班校友创业团队，共同探索这一新领域。 @ 藕舫天使我们认为，Pettichat代表了一种新的技术范式一-用通用人工智能的方法去理解非人类智能体，这是一种可迁移可扩展且充满想象力的全新领域。不同于市面上基于规则或简单分类的宠物翻译产品Pettichat构建的宠物交互大模型采用类Transformer架构，将宠物的叫声、肢体动作、生理信号统一建模为可预测的“行为Token”，实现了从“识别"到“理解与预测"的跨越。团队在数据工程上投入扎实，积累了大量专家标注的宠物语料，模型在情境声学等任务上能够展现出商用级的准确率，这些都构成了企业的长期竞争力。

/tag/翻译