Human vs machine translation
Xuất bản vào ngày 6 tháng 4 năm 2021 - Cập nhật vào ngày 1 tháng 10 năm 2024

Con người vs. Máy móc: Phiên bản dành cho ngành dịch thuật

Vào tháng 11 năm 2016, Google đã phát hành một phiên bản mới của Google Translate và gây tiếng vang trên toàn thế giới với “chất lượng phi thường” của các bản dịch mà công cụ mới cung cấp. Hàng chục bài viết so sánh phiên bản cũ với phiên bản mới bằng nhiều ngôn ngữ khác nhau, dịch và dịch ngược các văn bản văn học (được cho là khó dịch hơn), chiếm lĩnh các chuyên mục và blog của các phương tiện truyền thông nói chung và chuyên ngành trong nhiều tháng.

Những gì Google phát hành về mặt kỹ thuật là giới thiệu mô hình dịch thần kinh trong công cụ dịch máy của họ. Sự cải thiện lớn này về chất lượng của các bản dịch được cung cấp (miễn phí!) bởi Google Translate bắt đầu thay đổi ý kiến của công chúng về tương lai của ngành dịch thuật và vị trí của dịch máy trong đó. Sự phát triển của các công cụ mới và quyền truy cập vào các bản dịch máy chất lượng cao hơn đã thúc đẩy các khách hàng lớn của ngành cân nhắc cắt giảm chi phí bằng cách nhận các dịch vụ hậu chỉnh sửa thay vì dịch thuật. Biên tập hậu dịch máy sau đó trở nên được cung cấp rộng rãi hơn bởi các nhà cung cấp dịch vụ dịch thuật như một dịch vụ chuyên nghiệp. Những người chơi lớn và biên tập viên TMS đã tăng tốc đào tạo các động cơ MT của riêng họ. Ngành dịch thuật bắt đầu thay đổi sâu sắc.

Chúng tôi muốn trong bài viết này nhắc nhở bạn Dịch Máy là gì, nó đã trở thành gì và những thay đổi mà nó tạo ra trong ngành dịch thuật là gì.

Lịch sử dịch máy

Dịch máy (MT) có một lịch sử lâu dài bắt đầu từ năm 1949 khi nó xuất hiện lần đầu tiên trong Bản ghi nhớ về Dịch thuật của Warren Weaver. Nhà nghiên cứu đầu tiên trong lĩnh vực này, Yehosha Bar-Hillel, bắt đầu nghiên cứu của mình tại MIT vào năm 1951. Nhóm nghiên cứu MT từ Georgetown tiếp theo với một cuộc trình diễn công khai về hệ thống của nó vào năm 1954. Dịch máy cũng là một trong những ứng dụng phi số đầu tiên cho máy tính. Một lượng lớn các nhà nghiên cứu bắt đầu phát triển khi Hiệp hội Dịch thuật Máy và Ngôn ngữ học Tính toán xuất hiện ở Hoa Kỳ và Viện Hàn lâm Khoa học Quốc gia thành lập một hội đồng (ALPAC) để nghiên cứu MT.

MT có hiệu lực vào năm 1970, với Viện Dệt may Pháp dịch các bản tóm tắt từ và sang tiếng Pháp, tiếng Anh, tiếng Đức và tiếng Tây Ban Nha. Nhiều công ty MT khác nhau được ra mắt bao gồm Trados (1984), là công ty đầu tiên nâng cao và tiếp thị công nghệ Bộ nhớ dịch (TM) vào năm 1989.

Trong những năm gần đây, công nghệ dịch máy đã phát triển thành một khía cạnh mới và một tương lai đầy hứa hẹn với chúng tôi khi nghiên cứu về Dịch thuật máy thần kinh tiếp tục xây dựng một kỷ nguyên mới cho ngành công nghiệp.

Dịch máy thần kinh

Sử dụng lợi ích công nghệ của Deep Learning, Neural Machine Translation ngày nay đang thống trị các nỗ lực phát triển Dịch Máy trên khắp các châu lục. Là một lĩnh vực con của ngôn ngữ học tính toán, Neural Machine Translation về cơ bản là một ứng dụng của Deep Learning, trong đó một thuật toán được đào tạo bởi một lượng lớn tập dữ liệu của các văn bản đã dịch. Về cơ bản, nó sử dụng một mô hình dự đoán, mã hóa văn bản nguồn thành các số trước và giải mã nó trở lại thành văn bản cuối cùng trong ngôn ngữ được yêu cầu. Giải thích rất đơn giản, từ tất cả các khả năng, thuật toán chọn nhóm từ có xác suất cao nhất để được nhìn thấy cùng nhau và hiển thị nó như là bản dịch cuối cùng. Bạn càng có nhiều dữ liệu dịch để cung cấp cho máy của mình, bạn càng đến gần bản dịch nghe có vẻ tự nhiên hơn, vì các thuật toán cũng phát hiện ra các điểm nhấn phong cách và ngữ cảnh. Nhưng bạn phải đảm bảo các đầu vào rất sạch để huấn luyện động cơ đúng cách. Do đó, chất lượng của công cụ dịch máy thần kinh của bạn phụ thuộc vào số lượng mà còn cả chất lượng của dữ liệu dịch gốc mà bạn sử dụng để đào tạo các thuật toán của mình.

Cho đến nay, mặc dù các công cụ dịch máy đã cải thiện chất lượng đầu ra, vẫn có một vấn đề tin cậy về nội dung và văn bản sẽ được sử dụng một cách chuyên nghiệp. Điều tiếp theo là giải quyết để có các bản dịch chất lượng chấp nhận được với quy trình kết hợp, dịch máy sau đó là xác minh bằng con người, hay còn gọi là chỉnh sửa hậu kỳ.

Xu hướng hậu chỉnh sửa trong ngành dịch thuật

Khi dữ liệu dịch thuật số có sẵn đang phát triển theo cấp số nhân và Deep Learning mở ra cánh cổng cho dịch máy chất lượng cao hơn, phản xạ đầu tiên của người mua dịch vụ dịch thuật chuyên nghiệp là xem liệu họ có thể cắt giảm chi phí bằng cách sử dụng dịch máy trong quy trình dịch thuật của họ hay không. Do đầu ra MT chưa “sẵn sàng cho khách hàng” nhưng vẫn được cải thiện đáng kể, người tiêu dùng dịch vụ dịch thuật bắt đầu yêu cầu chỉnh sửa hậu kỳ Dịch Máy để có bản dịch nhanh hơn và rẻ hơn với chất lượng “chấp nhận được”. Biên tập viên sẽ không diễn đạt lại hoặc dịch lại mà sửa lỗi, nếu có, về ý nghĩa và làm cho văn bản nhất quán. Giọng điệu có thể hơi robot, nhưng ý nghĩa sẽ vẫn giữ nguyên.

Khi đại dịch COVID đẩy nhanh nội dung thương mại điện tử bằng nhiều ngôn ngữ, nhu cầu dịch thuật nhanh chóng và rẻ đã trở thành hiện thực đối với một số lượng lớn các doanh nghiệp vừa và nhỏ. Các triển lãm thương mại và sự kiện đã bị hủy bỏ, du lịch bị cấm trong nhiều tháng và các doanh nghiệp vừa và nhỏ bắt đầu phụ thuộc nhiều vào bán hàng trực tuyến hơn là các phương thức bán hàng truyền thống của họ. Trong bối cảnh này, chỉnh sửa hậu kỳ Dịch Máy tự áp dụng như một giải pháp có giá trị cho các doanh nghiệp vừa và nhỏ này. Hiện tượng này đã được quan sát bởi một số lượng lớn các Nhà cung cấp dịch vụ ngôn ngữ và một lời giải thích ngắn gọn cũng được đưa ra bởi Florian Faes, người sáng lập Slator và sự kiện ngành ngôn ngữ SlatorCon, được tổ chức từ xa và trực tuyến vào tháng 7 năm 2020.

Ngay cả đối với các tập đoàn lớn đang phát triển các công cụ MT của riêng họ, dịch vụ hậu biên dịch máy dường như là dịch vụ duy nhất cần thiết từ Nhà cung cấp dịch vụ ngôn ngữ (LSP). Ví dụ, dịch vụ Watson Language Translator của IBM được IBM sử dụng nội bộ như một công cụ dịch thuật nhưng có vẻ như đầu ra vẫn cần được xác minh.

Khi nhu cầu định hình đề nghị, các LSP bắt đầu thường xuyên cung cấp dịch vụ hậu biên dịch như một lựa chọn dịch thuật giá rẻ hơn nhưng hợp lệ cho các tập đoàn lớn, đối với sự thất vọng lớn của các cựu chiến binh trong ngành và các dịch giả chuyên nghiệp. Trường hợp chống lại xu hướng này cũng đang phát triển và có những điểm vững chắc.

Bạn có cần
dịch vụ dịch thuật không?
Hãy để dịch tài liệu của bạn được dịch bởi một dịch giả chuyên nghiệp với thời gian giao hàng chỉ trong vòng 12 giờ.


Dịch thuật con người, vẫn là lựa chọn tốt nhất cho nội dung chất lượng cao

Trong cuộc đua giữa máy móc và con người, dịch máy đang bắt kịp với những bước tiến vượt bậc, trong khi con người cũng đang phát triển khả năng dịch nhanh hơn nhờ các công cụ công nghệ, nhưng dường như vẫn chưa đủ nhanh. Dịch thuật con người vẫn là lựa chọn tốt nhất cho nội dung chất lượng cao và sáng tạo hiện nay. Và có một vài điểm hợp lệ ủng hộ điều này.

Việc thiếu các quy trình trong quản lý chất lượng và rủi ro trong khi sử dụng Dịch máy trong các ngành quan trọng (ví dụ như y tế và dược phẩm đối với hậu quả đối với sức khỏe của con người, tài chính và pháp lý về hậu quả tài chính đối với các tập đoàn) đang đặt ra một vấn đề cho việc triển khai các giải pháp MT quy mô lớn trong các ngành đó. Trách nhiệm trong trường hợp lỗi dịch thuật rất khó giải quyết. Không ai thực sự muốn mạo hiểm. Chỉnh sửa hậu kỳ đang diễn ra, vì có sự xác minh của con người và nó hạn chế rủi ro, nhưng nó vẫn không giải quyết được vấn đề đặt công cụ Dịch Máy vào chuỗi trách nhiệm ở đâu.

Nếu nội dung của bạn không có tính kỹ thuật cao, bạn cần một giọng điệu ít trang trọng hơn hoặc bạn muốn sáng tạo, thì máy móc vẫn chưa có ở đó. Bản dịch máy chủ yếu được cung cấp bởi các bản dịch chính thức (có sẵn miễn phí với khối lượng lớn và nhiều ngôn ngữ), các phiên bản ngôn ngữ khác nhau của các trang web công ty. Đó là nơi có sẵn các bộ dữ liệu khổng lồ. Khi nói đến nội dung sáng tạo, máy sẽ khó sao chép phong cách và cảm giác của văn bản hơn, vì không có đủ đầu vào trong hầu hết các ngôn ngữ. Nhân tiện, trong các tập đoàn sử dụng dịch máy và chỉnh sửa hậu kỳ dịch máy để tạo các phiên bản mới của trang web của họ, hoặc để dịch bài đăng và bài viết trên blog của họ, người sẽ tạo nội dung nguồn (thường bằng tiếng Anh) nên hạn chế sử dụng các hình thức phát biểu cụ thể trong văn bản. Chất lượng của văn bản nguồn sau đó bị giới hạn ở những gì sẽ được dịch chính xác bởi một máy, từ đó tạo ra cảm giác tổng thể tầm thường trên nội dung có sẵn. Nếu bạn sử dụng các bản dịch chuyên nghiệp của con người, bạn không thực sự phải suy nghĩ về những điều này để có được một văn bản chất lượng cao bằng bất kỳ ngôn ngữ nào...

Một điểm cuối cùng, về chất lượng và mối quan tâm về việc sử dụng rộng rãi các bản dịch máy sau chỉnh sửa so với bản dịch của con người, là như sau: khi các bản dịch máy sau chỉnh sửa tạo ra các bộ dữ liệu khổng lồ mới cung cấp năng lượng cho các công cụ, sự “tiến hóa” và đào tạo máy móc trở nên có vấn đề. Nếu chúng ta muốn có được kết quả chất lượng cao từ một giải pháp dịch máy, chúng ta nên cho nó ăn thực phẩm chất lượng cao. Cho đến nay, hầu hết các giải pháp dịch máy đều được đào tạo bởi các bản dịch của con người chất lượng tốt. Điều gì sẽ xảy ra khi hầu hết các bộ dữ liệu dịch mới có sẵn là kết quả của quá trình chỉnh sửa sau dịch máy? Chà, mối quan tâm là bạn không thể thực sự có được kết quả tốt hơn từ một máy nếu bạn không sử dụng đúng dữ liệu.

Nói tóm lại, nếu bạn đang tìm kiếm các bản dịch nhanh, rẻ và chất lượng tầm thường - nhưng chủ yếu là chính xác -, bạn có thể chọn dịch máy sau chỉnh sửa. Nếu bạn thực sự quan tâm đến cách bạn nói chuyện với mọi người bằng ngôn ngữ mục tiêu mà bạn muốn nội dung của mình được dịch sang, nếu bạn đang tìm kiếm nội dung sẽ tạo ra lưu lượng truy cập và doanh thu thực sự, hãy chọn một bộ đôi mắt chuyên nghiệp: Dịch thuật chuyên nghiệp sau đó là hiệu đính chính là giải pháp của bạn và nhiều nhà cung cấp dịch vụ dịch thuật sẽ rất vui khi phục vụ bạn.

Nhận tư vấn dịch thuật miễn phí từ đội ngũ của chúng tôi

Liên hệ với chúng tôi

KEREM ONEN

Xuất bản vào ngày 6 tháng 4 năm 2021

Công cụ tính toán chi phí dịch thuật

Bài viết này được dịch bởi phần mềm dịch máy tự động MotaWord.

Đội ngũ biên tập viên của chúng tôi hiện đang chỉnh sửa bài viết này để mang đến trải nghiệm tốt nhất cho bạn.

Tìm hiểu thêm về MotaWord Active.

Đăng ký nhận bản tin của chúng tôi
Tuyệt vời! Cảm ơn.
 
Tiếng việt
Tiếng việt