Human vs machine translation
2021년 4월 6일에 게시됨 - 2024년 10월 1일에 업데이트

인간 대 기계: 번역 업계 버전

카테고리: 번역 인사이트

2016년 11월, Google은 Google 번역의 새 버전을 출시했으며 새 엔진이 제공하는 번역의 “뛰어난 품질”로 전 세계적으로 화제를 불러일으켰습니다. 여러 언어로 구판과 신판을 비교하고, 문학 텍스트 (번역이 더 어렵다고 소문) 를 번역하고 역번역한 수십 개의 기사가 일반 및 전문 매체의 칼럼과 블로그를 몇 달 동안 점령했습니다.

구글이 기술적으로 공개한 것은 기계 번역 엔진에 신경망 번역 모델을 도입한 것입니다. 제공되는 번역의 품질이 크게 향상되었습니다 (무료!).by Google Translate는 번역 산업의 미래와 기계 번역의 위치에 대한 일반 대중의 의견을 바꾸기 시작했습니다. 새로운 도구의 개발과 고품질 기계 번역에 대한 접근으로 인해 업계의 대형 고객은 번역 대신 사후 편집 서비스를 통해 비용을 절감하는 것을 고려하게 되었습니다. 그 후 기계 번역 포스트에디팅은 번역 서비스 제공업체에서 전문 서비스로 더 널리 제공하게 되었습니다. 유명 기업과 TMS 편집자들은 자체 MT 엔진의 트레이닝을 가속화했습니다. 번역 산업이 크게 변화하기 시작했습니다.

이 글에서는 기계 번역이 무엇이었는지, 어떤 변화가 있었는지, 기계 번역이 번역 업계에 어떤 변화를 가져왔는지 상기시켜 드리고자 합니다.

기계 번역의 역사

기계 번역 (MT) 은 워렌 위버 (Warren Weaver) 의 번역 각서에 처음 등장한 1949년으로 거슬러 올라가는 오랜 역사를 가지고 있습니다. 이 분야의 첫 연구자인 예호샤 바-힐렐은 1951년 MIT에서 학업을 시작했습니다. 그 뒤를 이어 조지타운의 MT 연구팀이 1954년에 이 시스템을 공개적으로 시연했습니다. 기계 번역은 컴퓨터를 위한 최초의 비숫자 응용 프로그램 중 하나이기도 합니다. 미국에서 기계 번역 및 컴퓨터 언어학 협회가 등장하고 국립 과학 아카데미가 MT를 연구하기 위한 위원회 (ALPAC) 를 구성하면서 대규모 연구자들이 발전하기 시작했습니다.

MT는 1970년에 발효되었으며, 프랑스 섬유 연구소는 초록을 프랑스어, 영어, 독일어 및 스페인어로 번역했습니다. 1989년에 번역 메모리 (TM) 기술을 최초로 개선하고 판매한 Trados (1984) 를 비롯한 다양한 MT 회사가 출범했습니다.

최근 몇 년 동안 기계 번역 기술은 새로운 차원으로 발전했으며, 신경망 기계 번역에 대한 연구가 업계의 새 시대를 열어가고 있는 가운데 희망찬 미래가 우리에게 다가오고 있습니다.

신경망 기계 번역

인공신경망 기계 번역은 딥 러닝의 기술적 이점을 활용하여 오늘날 대륙 전반에 걸친 기계 번역 개발 노력을 주도하고 있습니다. 컴퓨터 언어학의 하위 분야인 신경망 기계 번역은 기본적으로 번역된 텍스트로 구성된 방대한 양의 데이터 세트를 사용하여 알고리즘을 학습하는 딥 러닝의 응용 프로그램입니다. 기본적으로 예측 모델을 사용하여 소스 텍스트를 먼저 숫자로 인코딩하고 요청된 언어의 최종 텍스트로 다시 디코딩합니다. 간단히 설명하자면, 알고리즘은 모든 가능성 중에서 함께 보일 확률이 가장 높은 단어 그룹을 선택하여 최종 번역으로 보여줍니다. 기계에 더 많은 번역 데이터를 공급할수록 알고리즘이 스타일 터치와 문맥을 감지하기 때문에 더욱 자연스러운 번역에 가까워집니다. 하지만 엔진을 제대로 트레이닝하려면 입력이 매우 깨끗해야 합니다. 따라서 신경망 기계 번역 엔진의 품질은 알고리즘 학습에 사용하는 원본 번역 데이터의 양뿐만 아니라 품질에 따라 달라집니다.

지금까지는 기계 번역 엔진이 결과물의 품질을 향상시켰지만 전문적으로 사용될 콘텐츠와 텍스트에 대한 신뢰 문제가 있습니다. 다음은 기계 번역에 이어 사람의 검증을 거친 후 사후 편집이라는 하이브리드 프로세스를 사용하여 적절한 품질의 번역을 위한 해결 방법입니다.

번역 업계의 포스트에디팅 트렌드

디지털로 이용 가능한 번역 데이터가 기하급수적으로 증가하고 딥러닝이 고품질 기계 번역의 문을 열었기 때문에 전문 번역 서비스 구매자가 가장 먼저 떠오른 것은 번역 프로세스에서 기계 번역을 사용하여 비용을 절감할 수 있는지 알아보는 것이었습니다. MT 출력이 아직 “고객이 바로 사용할 수 있는” 것은 아니지만 여전히 크게 개선됨에 따라 번역 서비스 소비자들은 “수용 가능한” 품질로 더 빠르고 저렴한 번역을 위해 기계 번역 포스트 에디팅을 요구하기 시작했습니다. 포스트 에디터는 표현을 바꾸거나 다시 번역하지 않지만 의미에 오류가 있는 경우 수정하고 텍스트의 일관성을 유지합니다. 어조가 약간 로봇적일 수도 있지만, 그 의미는 변함이 없을 것입니다.

COVID 팬데믹으로 인해 여러 언어의 전자 상거래 콘텐츠가 가속화되면서 많은 SME가 빠르고 저렴한 번역에 대한 필요성이 현실로 대두되었습니다. 무역 박람회와 행사가 취소되고 몇 달 동안 여행이 금지되었으며 SME는 기존 판매 방법보다 온라인 판매에 더 많이 의존하기 시작했습니다. 이러한 맥락에서 기계 번역 포스트에디팅은 이러한 중소기업에 유용한 솔루션으로 떠올랐습니다. 이 현상은 많은 언어 서비스 제공업체에서 관찰되었으며, Slator의 설립자인 Florian Faes와 2020년 7월에 원격 및 온라인으로 개최된 언어 산업 이벤트 SlaTorcon도 간략하게 설명했습니다.

자체 MT 엔진을 개발하는 대기업의 경우에도 언어 서비스 제공업체 (LSP) 에게 필요한 것은 기계 번역 포스트에디팅 서비스뿐인 것 같습니다. 예를 들어 IBM의 Watson Language Translator 서비스는 IBM에서 내부적으로 번역 도구로 사용하고 있지만 아직 출력 검증이 필요한 것 같습니다.

수요가 늘어남에 따라 LSP는 대기업, 업계 베테랑 및 전문 번역가들에게 저렴하면서도 유효한 번역 옵션으로 번역 후 편집 서비스를 정기적으로 제공하기 시작했습니다. 이러한 추세에 반대하는 주장도 증가하고 있으며 확실한 점이 있습니다.

번역 서비스가 필요하신가요?
전문 번역가에게 문서 번역을 의뢰하시면 12시간 이내에 받아보실 수 있습니다.


인간 번역, 여전히 고품질 콘텐츠를 위한 최상의 옵션

기계 대 인간 경쟁에서 기계 번역은 엄청난 도약을 이루고 있으며 인간도 더 빠르게 사용되는 기술 도구를 제공하는 데 앞장서고 있지만 충분히 빠르지는 않습니다. 인간 번역은 오늘날에도 고품질의 창의적인 콘텐츠를 위한 최고의 옵션으로 남아 있습니다. 그리고 이를 뒷받침하는 몇 가지 유효한 요점이 있습니다.

주요 산업 (예: 사람들의 건강에 미치는 영향에 대한 의료 및 제약, 기업에 미치는 재정적 영향에 대한 재무 및 법률) 에서 기계 번역을 사용하는 동안 품질 및 위험 관리 프로세스가 부족하기 때문에 이러한 산업에서 대규모 MT 솔루션을 구현하는 데 문제가 되고 있습니다. 번역 실수에 대한 책임은 해결하기가 어렵습니다. 아무도 정말로 위험을 감수하고 싶어하지 않습니다. 포스트에디팅은 사람의 검증이 필요하고 위험을 제한하기 때문에 발전하고 있습니다. 하지만 여전히 기계 번역 엔진을 책임 사슬에서 어디에 배치해야 하는지에 대한 문제를 해결하지는 못합니다.

콘텐츠가 고도로 기술적이지 않거나 덜 형식적인 어조가 필요하거나 창의력을 발휘하고 싶다면 아직 기계가 없습니다. 기계 번역은 대부분 기업 웹 사이트의 다양한 언어 버전인 공식 번역 (대량 및 여러 언어로 무료 제공) 으로 제공됩니다. 여기서 대규모 데이터 세트를 사용할 수 있습니다. 창의적인 콘텐츠의 경우 대부분의 언어에서 입력이 충분하지 않기 때문에 기계가 텍스트의 스타일과 느낌을 복제하기가 더 어렵습니다. 참고로, 예를 들어 웹 사이트의 새 버전을 만들거나 게시물 및 블로그 기사를 번역하기 위해 기계 번역 및 기계 번역 포스트 에디팅을 사용하는 기업의 경우 소스 콘텐츠 (주로 영어) 를 만드는 사람은 텍스트에 특정 비유를 사용하지 않는 것이 좋습니다. 그러면 원본 텍스트의 품질이 기계가 정확하게 번역할 수 있는 내용으로 제한되고, 결과적으로 사용 가능한 콘텐츠에 대해 전반적으로 평범하지 않은 느낌을 받게 됩니다. 전문적인 인간 번역을 사용한다면 어떤 언어로든 고품질 텍스트를 얻기 위해 이러한 것들에 대해 생각할 필요가 없습니다...

마지막으로 기계 번역 사후 편집과 인간 번역의 광범위한 사용에 대한 품질 및 우려에 대한 한 가지 요점은 다음과 같습니다. 사후 편집을 거친 기계 번역이 엔진에 데이터를 공급하는 새로운 대규모 데이터 세트를 생성함에 따라 기계의 “진화”와 학습은 문제가 됩니다. 기계 번역 솔루션에서 고품질 결과를 얻으려면 고품질 음식을 제공해야 합니다. 지금까지 대부분의 기계 번역 솔루션은 양질의 인간 번역을 통해 학습되었습니다. 새로 제공되는 번역 데이터 세트의 대부분이 기계 번역 사후 편집의 결과물인 경우 어떻게 될까요? 음, 문제는 올바른 데이터를 사용하지 않으면 기계에서 더 나은 결과를 얻을 수 없다는 것입니다.

간단히 말해서, 빠르고 저렴하며 평범한 품질이지만 대부분 정확한 번역을 찾고 있다면 기계 번역 포스트 에디팅을 사용할 수 있습니다. 콘텐츠를 번역하려는 대상 언어로 사람들에게 말하는 방식이 정말 마음에 들거나 실제 트래픽과 수익을 창출할 콘텐츠를 찾고 있다면 전문가의 눈을 두 배로 늘리십시오. 전문 번역에 이어 교정이 필요한 솔루션이 바로 해결책이며, 많은 번역 서비스 제공업체가 기꺼이 서비스를 제공할 것입니다.

저희 팀으로부터 무료 번역 상담을 받아보세요.

우리에게 연락주세요.

KEREM ONEN

2021년 4월 6일에 게시됨

번역 비용 계산기

이 글은 MotaWord 액티브 머신 번역을 통해 번역되었습니다.

저희 교정팀이 여러분께 최상의 경험을 제공하기 위해 현재 이 글을 검토하고 있습니다.

MotaWord Active에 대해 자세히 알아보세요.

뉴스레터를 구독하세요
훌륭합니다! 감사합니다.
 
한국어
한국어