当前,有道旗下所有翻译产品已累计超过十亿用户量。根据统计,自2019年以来,网易有道词典已持续六年获得“中国互联网APP TOP50赛道用户规模第一名”的荣誉,始终稳居教育应用领域的首位。
率先研发出统计机器翻译和神经网络翻译,有道再次引领行业发展,在翻译领域取得关键进展,让子曰翻译大模型2.0的整体表现有了显著提升。
依据全球知名翻译评估项目WMT的近期检测结果,子曰翻译大模型2.0在中文与英文互译方面的译文专业水准和稳定性,相较于上一代产品有了明显改善。在涉及人文科学、经济管理、日常事务、医疗健康、科学技术等十九个不同领域的综合评估里,子曰翻译大模型2.0同国内外各大通用型人工智能系统以及专业翻译工具进行了全方位的较量,统计结果揭示,子曰翻译大模型2.0在专业水准、精确性、语言规范性和表达特色上,实现了更优的转换效果,其模型输出品质荣获行业顶尖水平。
经过十个月的技术革新,子曰翻译大模型2.0在数据收集、算法优化和效果检验三个方面取得了显著进展,最终以140亿参数的细分领域模型达成了卓越的翻译水准,这充分彰显了有道在教育领域模型构建上的深度专业能力。
有道在数据方面,聚集了品质上乘的翻译素材贝语网校,并且执行了严谨的净化流程,同时,组织了英语专业八级考试通过者和专职译者,对他们进行细致的手工标记,因此,模型获得了极为丰富的优质资料库,有助于提升其处理各种翻译状况的效果。
有道在算法方面,运用子曰大模型开展后续训练,从而构建了更专业且精准的翻译基础模型,同时借助模型传承方法、模型合并方法、DPO方法等多种技术,成功防止了模型在应用中出现的记忆缺失现象,并且使模型的处理速度、结果正确度、输出连贯性等翻译表现有了显著进步。
评估工作借助翻译数据积累完成,有道自行研发了翻译评估模型Model,此模型的准确度超过COMET,COMET是当前最顶尖的评估标准之一,该模型为子曰翻译大模型的性能评估提供了可靠的量化参考,也构建了完善的人工评估流程,能够从多个角度对模型的翻译输出进行评估和剖析。
实际上,由于等开源模型的使用领域不断拓宽有道人工翻译,“特定情境加资料”正慢慢形成AI技术的竞争壁垒,成为其独特优势,有道公司凭借在翻译行业积累的丰富经验和资源,能够利用优质材料提升模型的表现有道人工翻译,这让它在该领域展现出突出的专业能力,专注于翻译工作,其小规模专业模型的翻译水平甚至超过了大型通用模型。
通用大模型的较量在于参数规模和计算能力强大,然而翻译工作并非单纯依靠参数堆砌就能提升专业性;当通用大模型争相扩大参数规模之际,我们依然更看重垂直模型的未来潜力——借助专业的垂直应用切实解决特定领域的难题,这也就是我们不断努力和发展的目标。网易有道相关人士如此说明。