2016 年 11 月,谷歌发布了新版本的谷歌翻译,并以新引擎提供的“非凡质量”的翻译在全世界引起轰动。 数十篇各种语言的新旧版本对比、翻译和回译文学文本(据说更难翻译)的文章,占据了一般和专业媒体的专栏和博客数月之久。
谷歌在技术上发布的是在他们的机器翻译引擎中引入神经翻译模型。 谷歌翻译(免费!)提供的翻译质量的重大改进开始改变公众对未来的看法翻译行业以及机器翻译在其中的位置。 新工具的开发和获得更高质量机器翻译的机会促使该行业的大客户考虑通过获得译后编辑服务而不是翻译来削减成本。 随后,机器翻译译后编辑作为一项专业服务被翻译服务提供商广泛提供。 大玩家和TMS编辑加速训练自己的MT引擎。 翻译行业开始发生深刻变化。
我们希望在本文中提醒您机器翻译是什么、它已经成为什么以及它在翻译行业中创造了哪些变化。
机器翻译的历史
机器翻译 (MT) 有着悠久的历史,可以追溯到 1949 年,当时它首次出现在 Warren Weaver 的翻译备忘录中。 该领域的第一位研究人员 Yehosha Bar-Hillel 于 1951 年在麻省理工学院开始了他的研究。 1954 年,乔治敦大学的 MT 研究团队对其系统进行了公开演示。 机器翻译也是最早的计算机非数字应用程序之一。 随着美国机器翻译协会和计算语言学协会的出现,以及美国国家科学院成立理事会 (ALPAC) 研究机器翻译,大量研究人员开始发展。
MT 于 1970 年生效,由法国纺织学院负责将摘要从法语、英语、德语和西班牙语翻译成法语、英语、德语和西班牙语。 推出了各种 MT 公司,包括 Trados (1984),它于 1989 年率先增强和销售翻译记忆库 (TM) 技术。
近年来,机器翻译技术已经发展到一个新的维度,随着神经机器翻译的研究不断为行业开创一个新时代,一个充满希望的未来向我们眨眼。
神经机器翻译
利用深度学习的技术优势,神经机器翻译如今在各大洲的机器翻译开发工作中占据主导地位。 作为计算语言学的一个子领域,神经机器翻译基本上是深度学习的一种应用,其中算法由大量翻译文本数据集训练。 它基本上使用预测模型,首先将源文本编码为数字,然后将其解码回所请求语言的最终文本。 非常简单地解释,从所有可能性中,算法选择最有可能一起出现的单词组并将其显示为最终翻译。 您需要为机器提供的翻译数据越多,您就越接近听起来更自然的翻译,因为算法也会检测到文体风格和上下文。 但是您必须确保输入非常干净才能正确训练引擎。 因此,您的神经机器翻译引擎的质量取决于您用来训练算法的原始翻译数据的数量和质量。
到目前为止,尽管机器翻译引擎提高了输出质量,但专业使用的内容和文本仍存在信任问题。 接下来是通过混合过程、机器翻译后进行人工验证(也称为后期编辑)来获得质量可接受的翻译的变通方法。
翻译行业的后期编辑趋势
随着数字可用翻译数据呈指数级增长,深度学习为更高质量的机器翻译打开了大门,专业翻译服务购买者的第一反应是看看他们是否可以在翻译过程中使用机器翻译来降低成本。 由于 MT 输出尚未“客户就绪”,但仍有显着改进,翻译服务的消费者开始要求机器翻译译后编辑,以获得速度更快、成本更低且质量“可接受”的翻译。 译后编辑不会重新措辞或重新翻译,但会修正错误(如果有)的意思并使文本保持一致。 语气可能有点机械化,但含义将保持不变。
随着 COVID 大流行加速了多种语言的电子商务内容,对大量中小企业来说,对快速和廉价翻译的需求变得真实。 贸易展览和活动被取消,旅行被禁止几个月,中小企业开始更多地依赖在线销售而不是传统的销售方式。 在此背景下,机器翻译译后编辑成为这些中小企业的宝贵解决方案。 这一现象被大量语言服务商观察到,并由创始人Florian Faes做了简要解释板条,以及在远程和在线举行的语言行业盛会 SlatorCon 2020 年 7 月.
即使对于开发自己的 MT 引擎的大公司来说,机器翻译译后编辑服务似乎也是语言服务提供商 (LSP) 唯一需要的服务。 例如,IBM 的 Watson Language Translator 服务被 IBM 内部用作翻译工具,但似乎输出仍然需要验证.
随着需求决定报价,LSP 开始定期向大公司、行业资深人士和专业翻译人员提供翻译后期编辑服务,作为一种更便宜但有效的翻译选择。 反对这种趋势的案例也越来越多,并且有充分的理由。
人工翻译,仍然是优质内容的最佳选择
在机器与人类的对比中,机器翻译 正在赶上 巨大的飞跃向前, 而人类也在进步 提供更快使用的技术工具, 但显然不够快。 人工翻译仍然是当今高质量和创意内容的最佳选择。 有几个有效的观点支持这一点。
在关键行业(例如医疗和制药对人类健康的影响,金融和法律对公司的财务影响)使用机器翻译时缺乏质量和风险管理流程,这给实施带来了问题这些行业中的大规模 MT 解决方案。 一旦出现翻译错误,责任难以解决。 没有人真的愿意冒险。 译后编辑正在取得进展,因为存在人工验证并限制了风险,但它仍然没有解决将机器翻译引擎置于责任链中何处的问题。
如果您的内容不是高度技术性的,您需要一种不太正式的语气,或者您想要有创意,那么,机器还不存在。 机器翻译主要由官方翻译(大量免费提供多种语言)、不同语言版本的企业网站提供。 这就是海量数据集可用的地方。 当涉及创意内容时,机器更难复制文本的风格和感觉,因为大多数语言的输入都不够。 顺便说一下,在使用机器翻译和机器翻译译后编辑来创建网站新版本或翻译帖子和博客文章的公司中,建议将创建源内容的人员(通常在英语)避免在文本中使用特定的修辞格。 源文本的质量受限于机器可以正确翻译的内容,这反过来又会给可用内容带来平庸的整体感觉。 如果你使用专业的人工翻译,你真的不必考虑这些来获得任何语言的高质量文本......
关于机器翻译后期编辑与人工翻译的广泛使用的质量和关注的最后一点如下:随着机器翻译后期编辑创建新的海量数据集来为引擎提供数据,“进化”和培训的机器变得有问题。 如果我们想从机器翻译解决方案中获得高质量的结果,我们应该用高质量的食物来喂养它。 到目前为止,大多数机器翻译解决方案都是由高质量的人工翻译训练的。 当大多数新可用的翻译数据集来自机器翻译译后编辑时会发生什么? 好吧,担心的是如果你不使用正确的数据,你就无法真正从机器上获得更好的结果。
简而言之,如果您正在寻找快速、廉价且质量一般(但主要是正确)的翻译,您可以选择机器翻译译后编辑。 如果您真的介意用目标语言与人打交道,您希望将您的内容翻译成该语言,如果您正在寻找能够产生实际流量和收入的内容,请寻求双重专业眼光:专业翻译和校对是您的最佳选择解决方案,许多翻译服务提供商将非常乐意为您服务。
联系我们的团队,获得免费翻译咨询
联系我们