Tin nóng trong ngày
Vài nhận xét về máy dịch Google_ Trần Văn Giang ghi lại
Google Translate được định nghĩa:
“... là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác.”
-(Wikipedia)
Google Translate “Dịch vụ dịch máy” này càng ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi tìm hiểu thêm với Google Translate vài giờ, chúng ta có thể có những nhận xét như sau đây một cách dễ dàng:
(1) Google Translate chỉ dịch “Chữ theo Chữ” (word for word translation), thông thường với độ chính xác khá cao.
Nhưng có một rõ rang không thể bỏ qua là máy không dịch đúng với nghĩa trong văn cảnh (contextual meaning). Chẳng hạn, Google Translate sẵn sàng dịch “cây gạo” là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton tree; silk-cotton.”
Hàng chục nhóm chữ chuyển mạch như “that said, that being said” (tuy vậy), “after all” (dẫu sao), “to be sure” (tuy vậy), "For all the...” (bất chấp/mặc dù)…,” chẳng hạn, đều bị dịch theo lối “word for word.”
Nếu gõ là: “For all the efforts he made for re-election, Trump ended up as a political loser.”
Google sẽ dịch là: “Đối với tất cả những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành một kẻ thất bại chính trị.”
(Câu này đáng lẽ phải dịch là: “Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối cuối cùng đã trở thành một kẻ thất bại chính tri.”)
Khi đi khám bệnh, bác sĩ có thể hỏi bạn: “Are you allergic to anything?” (có nghĩa là: “Anh có bị dị ứng gì không?”) Nếu muốn trả lời “không” theo kinh nghiệm của tôi, bạn sẽ nói: “Not that I know of.”
Ta thử gõ câu này vào cho máy dịch nhé!
Nếu gõ là: “Not that I know of.”
Google sẽ dịch là: “Không phải là tôi biết.”
Đây là một câu rất thông thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of” phải dịch là: “Theo chỗ tôi biết thì không” mới đúng.
(2) Tác động của Google Translate lên ngữ vựng tiếng Việt.
Qua thời gian, tuy nhiên, một số ngữ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một chữ được dùng sai lâu ngày vẫn có thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của ngôn ngữ có tính võ đoán (the development of language is arbitrary.)
Chúng tôi ghi nhận một vài trường hợp trong đó có lẽ nhờ máy dịch mà một số chữ đã trở nên thông dụng và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến chữ “elites” và “certain.” Thứ nhất, hễ máy gặp chữ "elites" thì nó sẽ tự động dịch ngay là “giới tinh hoa.” Hai chữ "tinh hoa" gợi lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, “elites” còn có nghĩa nôm na là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng hạn, thường dùng từ “elites” để chỉ giới lãnh đạo hay giai cấp thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn “giới chóp bu” để dịch “elites.” Nói cách khác, “elites” có thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu,” nhưng Google Translate luôn chọn “giới tinh hoa.”
Một ví dụ khác: Không biết do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào máy, hễ gặp chữ “certain” thì máy liền dịch là “nhất định” (sure; having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với những câu như “Các nỗ lực cấp cứu gặp phải một số hạn chế nhất định.” Nhưng “certain” còn có nghĩa như “some” khi một điều gì đó không được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch ngay là “Một nụ cười nhất định.” Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới có ý nghĩa. Nói cách khác, “certain” có thể dịch hoặc là “nhất định” hoặc là “nào đó,” nhưng Google Translate luôn luôn chọn “nhất định.”
Có lẽ do người lập trình (“programmer”) có lập trường chính trị (?) Đôi khi Google Translate tỏ ra biết chọn từ ngữ một cách rất "phải đạo chính trị" (in a politically correct fashion?). Người sử dụng không khỏi buồn cười khi thấy máy dịch đặt chữ “Ông” trước một số tên và gọi trổng đối với một số tên khác. Chẳng hạn, “Trump” không có chữ “Ông” đứng trước, nhưng Google Translate lại dịch “Xi” thành “Ông Tập.”
Ta thử so sánh vài ví dụ sau đây:
Nếu gõ là: “Donald Trump has married three times. Trump now has five children.”
Google sẽ dịch là: “Donald Trump đã kết hôn ba lần. Trump hiện có năm người con.”
Nhưng nếu gõ là: “Xi Jinping is the President of the People’s Republic of China. Xi is going to Hanoi next month.” [Nhớ chấm câu].
Google sẽ dịch là: “Tập Cận Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào tháng tới.”
(3) Google Translate rất yếu kém khi đụng đến thành ngữ (“idioms”), tiếng lóng (“slangs”)
Ta thử xem qua vài ví dụ về thành ngữ (“idioms”):
Nếu gõ là: "He knocked her up and left her.”
Google sẽ dịch là: “Anh ấy hất cô ấy lên và bỏ mặc cô ấy.” (Sai. “Knock up” = “Cho mang bầu"). Câu này phải dịch là: “Anh ấy cho cô ấy mang bầu rồi quất ngựa truy phong.”)
Nếu gõ là: “Donald Trump Jr.’s ‘Radicle’ Typo Has Twitter Users In Stitches.”
Google sẽ dịch là: “Typo ‘Radicle’ của Donald Trump Jr. có người dùng Twitter trong các lần cắt.” (Sai: “In stitches” = “Cười bể bụng"). Câu này phải dịch là: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr. đã làm người sử dụng Twitter cười bể bụng.”)
(4) Về ngữ pháp, Google Translate dịch rất tốt những mẫu câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ thuật.
Nhưng khi gặp những “cấu trúc cú pháp” (syntactical structures) của văn chương xưa, nó rất dịch dễ sai lạc, như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn, “but” = "mà không."
Ví dụ:
Nếu gõ là: “There is no mother but loves her children.”
Đầu ra của máy dịch: “Có mẹ nào mà thương con.”
(Máy đã dịch thành phản nghĩa. Câu trên tương đương với: “There is no mother that doesn’t love her children.” = “Có mẹ nào mà không thương con mình.”)
Như ở trên tôi đã nói “Google Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến không ngừng. Có thể trong một hai, giờ nữa nó sẽ dịch đúng những câu tôi đem ra làm ví dụ ở trên. Đã qua rồi cái thời mà nó dịch “The Universe in a Nutshell” là “Vũ trụ trong một hạt dẻ.”
Cứ lẽ thường, trừ thơ văn xưa ra, Google Translate trong trình trạng hiện nay đã giúp ích chúng ta rất nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã nói ngược lại điều tác giả muốn nói.
Trần Ngọc Cư
Trần Văn Giang (ghi lại)
Bàn ra tán vào (0)
Vài nhận xét về máy dịch Google_ Trần Văn Giang ghi lại
Google Translate được định nghĩa:
“... là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác.”
-(Wikipedia)
Google Translate “Dịch vụ dịch máy” này càng ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi tìm hiểu thêm với Google Translate vài giờ, chúng ta có thể có những nhận xét như sau đây một cách dễ dàng:
(1) Google Translate chỉ dịch “Chữ theo Chữ” (word for word translation), thông thường với độ chính xác khá cao.
Nhưng có một rõ rang không thể bỏ qua là máy không dịch đúng với nghĩa trong văn cảnh (contextual meaning). Chẳng hạn, Google Translate sẵn sàng dịch “cây gạo” là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton tree; silk-cotton.”
Hàng chục nhóm chữ chuyển mạch như “that said, that being said” (tuy vậy), “after all” (dẫu sao), “to be sure” (tuy vậy), "For all the...” (bất chấp/mặc dù)…,” chẳng hạn, đều bị dịch theo lối “word for word.”
Nếu gõ là: “For all the efforts he made for re-election, Trump ended up as a political loser.”
Google sẽ dịch là: “Đối với tất cả những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành một kẻ thất bại chính trị.”
(Câu này đáng lẽ phải dịch là: “Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối cuối cùng đã trở thành một kẻ thất bại chính tri.”)
Khi đi khám bệnh, bác sĩ có thể hỏi bạn: “Are you allergic to anything?” (có nghĩa là: “Anh có bị dị ứng gì không?”) Nếu muốn trả lời “không” theo kinh nghiệm của tôi, bạn sẽ nói: “Not that I know of.”
Ta thử gõ câu này vào cho máy dịch nhé!
Nếu gõ là: “Not that I know of.”
Google sẽ dịch là: “Không phải là tôi biết.”
Đây là một câu rất thông thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of” phải dịch là: “Theo chỗ tôi biết thì không” mới đúng.
(2) Tác động của Google Translate lên ngữ vựng tiếng Việt.
Qua thời gian, tuy nhiên, một số ngữ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một chữ được dùng sai lâu ngày vẫn có thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của ngôn ngữ có tính võ đoán (the development of language is arbitrary.)
Chúng tôi ghi nhận một vài trường hợp trong đó có lẽ nhờ máy dịch mà một số chữ đã trở nên thông dụng và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến chữ “elites” và “certain.” Thứ nhất, hễ máy gặp chữ "elites" thì nó sẽ tự động dịch ngay là “giới tinh hoa.” Hai chữ "tinh hoa" gợi lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, “elites” còn có nghĩa nôm na là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng hạn, thường dùng từ “elites” để chỉ giới lãnh đạo hay giai cấp thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn “giới chóp bu” để dịch “elites.” Nói cách khác, “elites” có thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu,” nhưng Google Translate luôn chọn “giới tinh hoa.”
Một ví dụ khác: Không biết do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào máy, hễ gặp chữ “certain” thì máy liền dịch là “nhất định” (sure; having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với những câu như “Các nỗ lực cấp cứu gặp phải một số hạn chế nhất định.” Nhưng “certain” còn có nghĩa như “some” khi một điều gì đó không được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch ngay là “Một nụ cười nhất định.” Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới có ý nghĩa. Nói cách khác, “certain” có thể dịch hoặc là “nhất định” hoặc là “nào đó,” nhưng Google Translate luôn luôn chọn “nhất định.”
Có lẽ do người lập trình (“programmer”) có lập trường chính trị (?) Đôi khi Google Translate tỏ ra biết chọn từ ngữ một cách rất "phải đạo chính trị" (in a politically correct fashion?). Người sử dụng không khỏi buồn cười khi thấy máy dịch đặt chữ “Ông” trước một số tên và gọi trổng đối với một số tên khác. Chẳng hạn, “Trump” không có chữ “Ông” đứng trước, nhưng Google Translate lại dịch “Xi” thành “Ông Tập.”
Ta thử so sánh vài ví dụ sau đây:
Nếu gõ là: “Donald Trump has married three times. Trump now has five children.”
Google sẽ dịch là: “Donald Trump đã kết hôn ba lần. Trump hiện có năm người con.”
Nhưng nếu gõ là: “Xi Jinping is the President of the People’s Republic of China. Xi is going to Hanoi next month.” [Nhớ chấm câu].
Google sẽ dịch là: “Tập Cận Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào tháng tới.”
(3) Google Translate rất yếu kém khi đụng đến thành ngữ (“idioms”), tiếng lóng (“slangs”)
Ta thử xem qua vài ví dụ về thành ngữ (“idioms”):
Nếu gõ là: "He knocked her up and left her.”
Google sẽ dịch là: “Anh ấy hất cô ấy lên và bỏ mặc cô ấy.” (Sai. “Knock up” = “Cho mang bầu"). Câu này phải dịch là: “Anh ấy cho cô ấy mang bầu rồi quất ngựa truy phong.”)
Nếu gõ là: “Donald Trump Jr.’s ‘Radicle’ Typo Has Twitter Users In Stitches.”
Google sẽ dịch là: “Typo ‘Radicle’ của Donald Trump Jr. có người dùng Twitter trong các lần cắt.” (Sai: “In stitches” = “Cười bể bụng"). Câu này phải dịch là: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr. đã làm người sử dụng Twitter cười bể bụng.”)
(4) Về ngữ pháp, Google Translate dịch rất tốt những mẫu câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ thuật.
Nhưng khi gặp những “cấu trúc cú pháp” (syntactical structures) của văn chương xưa, nó rất dịch dễ sai lạc, như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn, “but” = "mà không."
Ví dụ:
Nếu gõ là: “There is no mother but loves her children.”
Đầu ra của máy dịch: “Có mẹ nào mà thương con.”
(Máy đã dịch thành phản nghĩa. Câu trên tương đương với: “There is no mother that doesn’t love her children.” = “Có mẹ nào mà không thương con mình.”)
Như ở trên tôi đã nói “Google Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến không ngừng. Có thể trong một hai, giờ nữa nó sẽ dịch đúng những câu tôi đem ra làm ví dụ ở trên. Đã qua rồi cái thời mà nó dịch “The Universe in a Nutshell” là “Vũ trụ trong một hạt dẻ.”
Cứ lẽ thường, trừ thơ văn xưa ra, Google Translate trong trình trạng hiện nay đã giúp ích chúng ta rất nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã nói ngược lại điều tác giả muốn nói.
Trần Ngọc Cư
Trần Văn Giang (ghi lại)