今天腾讯混元宣布正式开源翻译模型1.5版本,共包含两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B。
目前,两个模型均已在腾讯混元官网上线,在Github和Huggingface等开源社区也可直接下载使用。
据了解,该版本支持33个语种互译以及5种民汉/方言,除中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。
其中,HY-MT1.5-1.8B主要面向手机等消费级设备场景,经过量化,支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行,并且在参数量极小的前提下,效果超过了大部分商用翻译API。
同时,模型也体现出了极致的效率和性价比,与主流商用翻译模型API对比,HY-MT1.5-1.8B 推理速度更快,处理50个tokens的平均耗时只有0.18秒,其他模型的时间在0.4秒左右。
以下为混元Tencent-HY-MT1.5-1.8B与苹果iPhone自带离线翻译的结果对比:
HY-MT1.5-7B模型效果相比前一版本效果有较大提升,是此前获得WMT25比赛30个语种翻译冠军模型的升级版,重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况,实用性进一步增加。
官方表示,在部分用户实际使用场景下,混元翻译1.8B和7B两个尺寸模型同时使用,可以实现端侧和云侧模型的协同部署,提升模型的效果的一致性和稳定性。
© 版权声明
商娱网所有文章,如无特殊说明或标注,均来自于互联网或为商娱网用户原创发布。任何个人或组织,在未征得原作者同意时,禁止复制、盗用、采集、发布商娱网内容到任何网站、书籍等各类媒体平台。如若商娱网内容侵犯了原著者的合法权益,可联系我们进行处理。
相关文章
暂无评论...

