В ноябре 2016 года Google выпустила новую версию Google Translate и вызвала бурю негодования по всему миру благодаря «необычайному качеству» переводов, которые обеспечивает новый движок. Десятки статей, сравнивающих старую версию с новой на разных языках, перевод и обратный перевод художественных текстов (считающихся более сложными для перевода), месяцами занимали колонки и блоги общих и специализированных СМИ.
С технической точки зрения Google представил модель нейронного перевода в механизме машинного перевода. Это серьезное улучшение качества переводов, предоставляемых (бесплатно!) Google Translate, начало менять мнение широкой публики о будущем индустрия переводов и место в нем машинного перевода. Разработка новых инструментов и доступ к более качественным машинным переводам подтолкнули крупных клиентов отрасли к сокращению расходов за счет получения услуг постредактирования вместо переводов. Затем постредактирование машинного перевода стало более широко предлагаться поставщиками переводческих услуг в качестве профессиональной услуги. Крупные игроки и редакторы TMS ускорили обучение своих машин машинного перевода. Индустрия переводов начала сильно меняться.
В этой статье мы хотели напомнить вам, что такое машинный перевод, чем он стал и какие изменения он вносит в переводческую отрасль.
История машинного перевода
Машинный перевод (МП) имеет долгую историю, которая восходит к 1949 году, когда он впервые появился в Меморандуме о переводе Уоррена Уивера. Первый исследователь в этой области, Йегоша Бар-Хиллел, начинает обучение в Массачусетском технологическом институте в 1951 году. Группа исследователей МТ из Джорджтауна проводит публичную демонстрацию своей системы в 1954 году. Машинный перевод также является одним из первых нечисловых приложений для компьютеров. Большое количество исследователей начало развиваться, когда в США возникла Ассоциация машинного перевода и компьютерной лингвистики, а Национальная академия наук сформировала совет (ALPAC) для изучения МП.
МТ вступает в силу в 1970 году, когда Французский институт текстиля переводит рефераты с французского, английского, немецкого и испанского языков и на них. Запускаются различные компании машинного перевода, в том числе Trados (1984 г.), которая первой усовершенствовала и выпустила на рынок технологию Translation Memory (TM) в 1989 г.
В последние годы технология машинного перевода превратилась в новое измерение, и нам открывается многообещающее будущее, поскольку исследования в области нейронного машинного перевода продолжают строить новую эру для отрасли.
Нейронный машинный перевод
Используя технологические преимущества глубокого обучения, нейронный машинный перевод в настоящее время доминирует в усилиях по развитию машинного перевода на всех континентах. Как подобласть компьютерной лингвистики, нейронный машинный перевод в основном представляет собой приложение глубокого обучения, в котором алгоритм обучается на огромном количестве наборов данных переведенных текстов. Он в основном использует модель прогнозирования, сначала кодируя исходный текст в числа, а затем декодируя его обратно в окончательный текст на запрашиваемом языке. Объясняется очень просто: из всех возможных вариантов алгоритм выбирает группу слов, которые с наибольшей вероятностью встречаются вместе, и показывает ее как окончательный перевод. Чем больше данных перевода вы должны предоставить своей машине, тем ближе вы будете к более естественно звучащему переводу, поскольку алгоритмы также обнаруживают стилистические штрихи и контекст. Но вы должны убедиться, что входные данные очень чистые, чтобы правильно обучить двигатель. Таким образом, качество вашего механизма нейронного машинного перевода зависит от количества, а также от качества исходных данных перевода, которые вы используете для обучения своих алгоритмов.
До сих пор, несмотря на то, что механизмы машинного перевода улучшили качество вывода, существует проблема доверия к контенту и текстам, которые будут использоваться профессионально. Далее следует обходной путь для перевода приемлемого качества с помощью гибридного процесса, машинного перевода с последующей проверкой человеком, также известного как постредактирование.
Тенденция постредактирования в переводческой индустрии
По мере того, как количество данных для перевода, доступных в цифровом виде, растет в геометрической прогрессии, а глубокое обучение открыло двери для машинного перевода более высокого качества, первой реакцией покупателей профессиональных переводческих услуг было посмотреть, смогут ли они сократить расходы, используя машинный перевод в своих процессах перевода. Поскольку вывод машинного перевода еще не «готов к работе с клиентами», но все еще значительно улучшен, потребители переводческих услуг начали запрашивать постредактирование машинного перевода для более быстрого и дешевого перевода с «приемлемым» качеством. Постредактор не будет перефразировать или ретранслировать, а исправит ошибки, если таковые имеются, по смыслу и сделает текст согласованным. Тон может быть немного роботизированным, но смысл останется прежним.
Поскольку пандемия COVID ускорила выпуск контента для электронной коммерции на нескольких языках, потребность в быстрых и дешевых переводах стала реальной для большого числа малых и средних предприятий. Торговые выставки и мероприятия были отменены, поездки запрещены на несколько месяцев, а МСП стали больше зависеть от онлайн-продаж, чем от своих традиционных методов продаж. В этом контексте постредактирование машинного перевода зарекомендовало себя как ценное решение для этих малых и средних предприятий. Это явление было замечено большим количеством поставщиков языковых услуг, и краткое объяснение дал также Флориан Фаес, основатель Слейтор , а также мероприятие языковой индустрии SlatorCon, которое проходило удаленно и онлайн в июль 2020 г. .
Даже для крупных корпораций, разрабатывающих свои собственные механизмы машинного перевода, услуга постредактирования машинного перевода кажется единственной, которая требуется от поставщика языковых услуг (LSP). Например, служба IBM Watson Language Translator используется внутри IBM в качестве инструмента для перевода, но кажется, что вывод все еще должен быть обработан. проверено .
По мере того, как спрос формировал предложение, поставщики переводческих услуг начали регулярно предлагать услуги постредактирования перевода как более дешевый, но действенный вариант перевода для крупных корпораций, к большому разочарованию ветеранов отрасли и профессиональных переводчиков. Доводы против этой тенденции также растут и имеют веские аргументы.
услуги сертифицированного перевода?
Человеческий перевод, по-прежнему лучший вариант для высококачественного контента
В гонке машин и людей, Машинный перевод догоняет огромные скачки вперед, в то время как люди также продвигаются вперед в доставке более быстро используемых технических инструментов, но, очевидно, недостаточно быстро. Сегодня человеческий перевод остается лучшим вариантом для качественного и креативного контента. И есть несколько веских аргументов в пользу этого.
Отсутствие процессов управления качеством и рисками при использовании машинного перевода в критически важных отраслях (медицинской и фармацевтической, например, для последствий для здоровья людей, а также финансовых и юридических для финансовых последствий для корпораций) создает проблему для внедрения крупномасштабные решения машинного перевода в этих отраслях. Ответственность в случае ошибок перевода трудно решить. Никто особо не хочет рисковать. Постредактирование пробивается, так как есть человеческая проверка и это ограничивает риски, но все равно не решает проблему, куда поставить движок машинного перевода в цепочке ответственности.
Если ваш контент не слишком технический, вам нужен менее формальный тон или вы хотите быть креативным, ну, машин еще нет. Машинные переводы в основном подпитываются официальными переводами (доступными бесплатно в больших объемах и на многих языках), различными языковыми версиями корпоративных сайтов. Вот где доступны массивные наборы данных. Когда дело доходит до творческого контента, машине сложнее воспроизвести стиль и ощущение текста, поскольку на большинстве языков недостаточно ввода. Кстати, в корпорациях, которые используют машинный перевод и постредактирование машинного перевода, например, для создания новых версий своего веб-сайта или для перевода своих сообщений и статей в блогах, рекомендуется человеку, который будет создавать исходный контент (часто в английский) воздерживаться от использования в тексте определенных фигур речи. В этом случае качество исходного текста ограничивается тем, что будет правильно переведено машиной, что, в свою очередь, создает посредственное общее впечатление от доступного контента. Если вы используете профессиональные человеческие переводы, вам не нужно думать об этом, чтобы получить качественный текст на любом языке…
И последнее замечание, касающееся качества и опасений по поводу широкого использования постредактирования машинного перевода по сравнению с переводами, сделанными человеком, заключается в следующем: поскольку машинные переводы с постредактированием создают новые массивные наборы данных, которые питают механизмы, «эволюция» и обучение машин становятся проблематичными. Если мы хотим получить качественные результаты от решения для машинного перевода, мы должны кормить его качественной едой. До сих пор большинство решений для машинного перевода были обучены человеческому переводу хорошего качества. Что произойдет, когда большинство вновь доступных наборов переводческих данных будут получены в результате постредактирования машинного перевода? Ну, проблема в том, что вы не можете получить лучшие результаты от машины, если вы не используете правильные данные.
Короче говоря, если вам нужны быстрые, дешевые и посредственного качества, но в основном правильные переводы, вы можете воспользоваться постредактированием машинного перевода. Если вы действительно возражаете против того, как вы обращаетесь к людям на целевом языке, на который вы хотите перевести свой контент, если вы ищете контент, который будет генерировать реальный трафик и доход, обратите внимание на двойной набор профессиональных взглядов: профессиональный перевод с последующей корректурой — это ваш выбор. решение, и многие поставщики переводческих услуг будут рады вам помочь.
Получите бесплатную консультацию по переводу от нашей команды
Контакты