Tencent-HY-MT1.5 是腾讯混元开源的机器翻译模型系列,包含 1.8B 和 7B 两个版本,支持多语种互译、术语库、上下文翻译和带格式文本翻译。重点讲清它的模型定位、评测表现、端云协同部署方式,以及 On-Policy Distillation 如何让小模型接近大模型效果。
围绕 AI 工程中最常见的训练、推理、Transformer 架构和性能优化手段展开,讲清模型从数据到服务的完整链路,以及并行、量化、蒸馏、缓存等方案分别解决什么问题。