Tin nóng trong ngày

Vài nhận xét về máy dịch Google_ Trần Văn Giang ghi lại

xxx



4360q
Google Translate
được định nghĩa:

  

“... là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác.” 

-(Wikipedia) 

 

Google TranslateDịch vụ dịch máy” này càng ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi tìm hiểu thêm với Google Translate vài giờ, chúng ta có thể có những nhận xét như sau đây một cách dễ dàng: 

 

(1) Google Translate chỉ dịch “Chữ theo Chữ” (word for word translation), thông thường với độ chính xác khá cao. 

 

Nhưng có một rõ rang không thể bỏ qua là máy không dịch đúng với nghĩa trong văn cảnh (contextual meaning). Chẳng hạn,  Google Translate sẵn sàng dịch “cây gạo” là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton tree; silk-cotton.” 

 

Hàng chục nhóm chữ chuyển mạch như “that said, that being said” (tuy vậy), “after all” (dẫu sao), “to be sure” (tuy vậy), "For all the...” (bất chấp/mặc dù)…,” chẳng hạn, đều bị dịch theo lối “word for word.” 

 

Nếu gõ là: “For all the efforts he made for re-election, Trump ended up as a political loser.” 

Google sẽ dịch là: “Đối với tất cả những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành một kẻ thất bại chính trị.” 

(Câu này đáng lẽ phải dịch là: “Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối cuối cùng đã trở thành một kẻ thất bại chính tri.”)

Khi đi khám bệnh, bác sĩ có thể hỏi bạn: “Are you allergic to anything?” (có nghĩa là: “Anh có bị dị ứng gì không?”) Nếu muốn trả lời “không” theo kinh nghiệm của tôi, bạn sẽ nói: “Not that I know of.” 

 

Ta thử gõ câu này vào cho máy dịch nhé! 

 

Nếu gõ là: “Not that I know of. 

Google sẽ dịch là: “Không phải là tôi biết.” 

 

Đây là một câu rất thông thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of” phải dịch là: “Theo chỗ tôi biết thì không” mới đúng. 

 

(2) Tác động của Google Translate lên ngữ vựng tiếng Việt. 

 

Qua thời gian, tuy nhiên, một số ngữ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một chữ được dùng sai lâu ngày vẫn có thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của ngôn ngữ có tính võ đoán (the development of language is arbitrary.)

  

Chúng tôi ghi nhận một vài trường hợp trong đó có lẽ nhờ máy dịch mà một số chữ đã trở nên thông dụng và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến chữ “elites và “certain.”  Thứ nhất, hễ máy gặp chữ "elites" thì nó sẽ tự động dịch ngay là “giới tinh hoa.” Hai chữ "tinh hoa" gợi lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, “elites còn có nghĩa nôm na là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng hạn, thường dùng từ “elites để chỉ giới lãnh đạo hay giai cấp thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn “giới chóp bu” để dịch “elites.”  Nói cách khác, “elites” có thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu,” nhưng Google Translate luôn chọn “giới tinh hoa.” 

 

Một ví dụ khác: Không biết do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào máy, hễ gặp chữ “certain thì máy liền dịch là “nhất định” (sure; having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với những câu như “Các nỗ lực cấp cứu gặp phải một số hạn chế nhất định.” Nhưng “certain còn có nghĩa như “some” khi một điều gì đó không được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch ngay là “Một nụ cười nhất định.” Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới có ý nghĩa. Nói cách khác, “certaincó thể dịch hoặc là “nhất định” hoặc là “nào đó,” nhưng Google Translate luôn luôn chọn “nhất định.” 

 

Có lẽ do người lập trình (“programmer”) có lập trường chính trị (?)  Đôi khi Google Translate tỏ ra biết chọn từ ngữ một cách rất "phải đạo chính trị" (in a politically correct fashion?). Người sử dụng không khỏi buồn cười khi thấy máy dịch đặt chữ “Ông” trước một số tên và gọi trổng  đối với một số tên khác. Chẳng hạn, “Trump” không có chữ “Ông” đứng trước, nhưng Google Translate lại dịch “Xi” thành “Ông Tập.”

  

Ta thử so sánh vài ví dụ sau đây:

  

Nếu gõ là: “Donald Trump has married three times. Trump now has five children.” 

Google sẽ dịch là: “Donald Trump đã kết hôn ba lần. Trump hiện có năm người con.

  

Nhưng nếu gõ là: “Xi Jinping is the President of the People’s Republic of China. Xi is going to Hanoi next month.” [Nhớ chấm câu]. 

Google sẽ dịch là: “Tập Cận Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào tháng tới.” 

 

(3) Google Translate rất yếu kém khi đụng đến thành ngữ (“idioms”), tiếng lóng (“slangs”) 

 

Ta thử xem qua vài ví dụ về thành ngữ (“idioms”)

 

Nếu gõ là: "He knocked her up and left her.” 

Google sẽ dịch là: “Anh ấy hất cô ấy lên và bỏ mặc cô ấy.” (Sai. “Knock up” = “Cho mang bầu").  Câu này phải dịch là: “Anh ấy cho cô ấy mang bầu rồi quất ngựa truy phong.”) 

   

Nếu gõ là: “Donald Trump Jr.’s ‘Radicle’ Typo Has Twitter Users In Stitches.” 

Google sẽ dịch là: “Typo ‘Radicle’ của Donald Trump Jr. có người dùng Twitter trong các lần cắt.” (Sai: “In stitches” = “Cười bể bụng"). Câu này phải dịch là: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr. đã làm người sử dụng Twitter cười bể bụng.”) 

 

(4) Về ngữ pháp, Google Translate dịch rất tốt những mẫu câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ thuật.  

 

Nhưng khi gặp những “cấu trúc cú pháp” (syntactical structures) của văn chương xưa, nó rất dịch dễ sai lạc, như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn, “but” = "mà không." 

 

Ví dụ:

  

Nếu gõ là: “There is no mother but loves her children.” 

Đầu ra của máy dịch: “Có mẹ nào mà thương con.” 

(Máy đã dịch thành phản nghĩa. Câu trên tương đương với: “There is no mother that doesn’t love her children.” = “Có mẹ nào mà không thương con mình.”) 

 

Như ở trên tôi đã nói “Google Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến không ngừng. Có thể trong một hai, giờ nữa nó sẽ dịch đúng những câu tôi đem ra làm ví dụ ở trên. Đã qua rồi cái thời mà nó dịch “The Universe in a Nutshell” là “Vũ trụ trong một hạt dẻ.” 

 

Cứ lẽ thường, trừ thơ văn xưa ra, Google Translate trong trình trạng hiện nay đã giúp ích chúng ta rất nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã nói ngược lại điều tác giả muốn nói. 

 

Trần Ngọc Cư

Trần Văn Giang (ghi lại)

Bàn ra tán vào (0)

Comment




  • Input symbols

Vài nhận xét về máy dịch Google_ Trần Văn Giang ghi lại

xxx



4360q
Google Translate
được định nghĩa:

  

“... là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác.” 

-(Wikipedia) 

 

Google TranslateDịch vụ dịch máy” này càng ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi tìm hiểu thêm với Google Translate vài giờ, chúng ta có thể có những nhận xét như sau đây một cách dễ dàng: 

 

(1) Google Translate chỉ dịch “Chữ theo Chữ” (word for word translation), thông thường với độ chính xác khá cao. 

 

Nhưng có một rõ rang không thể bỏ qua là máy không dịch đúng với nghĩa trong văn cảnh (contextual meaning). Chẳng hạn,  Google Translate sẵn sàng dịch “cây gạo” là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton tree; silk-cotton.” 

 

Hàng chục nhóm chữ chuyển mạch như “that said, that being said” (tuy vậy), “after all” (dẫu sao), “to be sure” (tuy vậy), "For all the...” (bất chấp/mặc dù)…,” chẳng hạn, đều bị dịch theo lối “word for word.” 

 

Nếu gõ là: “For all the efforts he made for re-election, Trump ended up as a political loser.” 

Google sẽ dịch là: “Đối với tất cả những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành một kẻ thất bại chính trị.” 

(Câu này đáng lẽ phải dịch là: “Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối cuối cùng đã trở thành một kẻ thất bại chính tri.”)

Khi đi khám bệnh, bác sĩ có thể hỏi bạn: “Are you allergic to anything?” (có nghĩa là: “Anh có bị dị ứng gì không?”) Nếu muốn trả lời “không” theo kinh nghiệm của tôi, bạn sẽ nói: “Not that I know of.” 

 

Ta thử gõ câu này vào cho máy dịch nhé! 

 

Nếu gõ là: “Not that I know of. 

Google sẽ dịch là: “Không phải là tôi biết.” 

 

Đây là một câu rất thông thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of” phải dịch là: “Theo chỗ tôi biết thì không” mới đúng. 

 

(2) Tác động của Google Translate lên ngữ vựng tiếng Việt. 

 

Qua thời gian, tuy nhiên, một số ngữ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một chữ được dùng sai lâu ngày vẫn có thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của ngôn ngữ có tính võ đoán (the development of language is arbitrary.)

  

Chúng tôi ghi nhận một vài trường hợp trong đó có lẽ nhờ máy dịch mà một số chữ đã trở nên thông dụng và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến chữ “elites và “certain.”  Thứ nhất, hễ máy gặp chữ "elites" thì nó sẽ tự động dịch ngay là “giới tinh hoa.” Hai chữ "tinh hoa" gợi lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, “elites còn có nghĩa nôm na là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng hạn, thường dùng từ “elites để chỉ giới lãnh đạo hay giai cấp thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn “giới chóp bu” để dịch “elites.”  Nói cách khác, “elites” có thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu,” nhưng Google Translate luôn chọn “giới tinh hoa.” 

 

Một ví dụ khác: Không biết do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào máy, hễ gặp chữ “certain thì máy liền dịch là “nhất định” (sure; having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với những câu như “Các nỗ lực cấp cứu gặp phải một số hạn chế nhất định.” Nhưng “certain còn có nghĩa như “some” khi một điều gì đó không được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch ngay là “Một nụ cười nhất định.” Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới có ý nghĩa. Nói cách khác, “certaincó thể dịch hoặc là “nhất định” hoặc là “nào đó,” nhưng Google Translate luôn luôn chọn “nhất định.” 

 

Có lẽ do người lập trình (“programmer”) có lập trường chính trị (?)  Đôi khi Google Translate tỏ ra biết chọn từ ngữ một cách rất "phải đạo chính trị" (in a politically correct fashion?). Người sử dụng không khỏi buồn cười khi thấy máy dịch đặt chữ “Ông” trước một số tên và gọi trổng  đối với một số tên khác. Chẳng hạn, “Trump” không có chữ “Ông” đứng trước, nhưng Google Translate lại dịch “Xi” thành “Ông Tập.”

  

Ta thử so sánh vài ví dụ sau đây:

  

Nếu gõ là: “Donald Trump has married three times. Trump now has five children.” 

Google sẽ dịch là: “Donald Trump đã kết hôn ba lần. Trump hiện có năm người con.

  

Nhưng nếu gõ là: “Xi Jinping is the President of the People’s Republic of China. Xi is going to Hanoi next month.” [Nhớ chấm câu]. 

Google sẽ dịch là: “Tập Cận Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào tháng tới.” 

 

(3) Google Translate rất yếu kém khi đụng đến thành ngữ (“idioms”), tiếng lóng (“slangs”) 

 

Ta thử xem qua vài ví dụ về thành ngữ (“idioms”)

 

Nếu gõ là: "He knocked her up and left her.” 

Google sẽ dịch là: “Anh ấy hất cô ấy lên và bỏ mặc cô ấy.” (Sai. “Knock up” = “Cho mang bầu").  Câu này phải dịch là: “Anh ấy cho cô ấy mang bầu rồi quất ngựa truy phong.”) 

   

Nếu gõ là: “Donald Trump Jr.’s ‘Radicle’ Typo Has Twitter Users In Stitches.” 

Google sẽ dịch là: “Typo ‘Radicle’ của Donald Trump Jr. có người dùng Twitter trong các lần cắt.” (Sai: “In stitches” = “Cười bể bụng"). Câu này phải dịch là: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr. đã làm người sử dụng Twitter cười bể bụng.”) 

 

(4) Về ngữ pháp, Google Translate dịch rất tốt những mẫu câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ thuật.  

 

Nhưng khi gặp những “cấu trúc cú pháp” (syntactical structures) của văn chương xưa, nó rất dịch dễ sai lạc, như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn, “but” = "mà không." 

 

Ví dụ:

  

Nếu gõ là: “There is no mother but loves her children.” 

Đầu ra của máy dịch: “Có mẹ nào mà thương con.” 

(Máy đã dịch thành phản nghĩa. Câu trên tương đương với: “There is no mother that doesn’t love her children.” = “Có mẹ nào mà không thương con mình.”) 

 

Như ở trên tôi đã nói “Google Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến không ngừng. Có thể trong một hai, giờ nữa nó sẽ dịch đúng những câu tôi đem ra làm ví dụ ở trên. Đã qua rồi cái thời mà nó dịch “The Universe in a Nutshell” là “Vũ trụ trong một hạt dẻ.” 

 

Cứ lẽ thường, trừ thơ văn xưa ra, Google Translate trong trình trạng hiện nay đã giúp ích chúng ta rất nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã nói ngược lại điều tác giả muốn nói. 

 

Trần Ngọc Cư

Trần Văn Giang (ghi lại)

BÀN RA TÁN VÀO

Đề bài :"Tiếng Việt, yêu & ghét" - Lê Hữu ( Trần Văn Giang ghi lại )

'vô hình trung' là nghĩa gì vậy, sao cứ thích dùng, hình như có nghĩa là 'vô tình'

Xem Thêm

Đề bài :TIN CHIẾN SỰ MỚI NHẤT[ CẬP NHẬT NGÀY 20 -5 - 2022 ]

Suu cao,thue nang,nhu yeu pham tang gia.Kinh te eo seo...Vay ma dang Lua van lay tien cua dan tro giup linh tinh.Mo cua bien gioi.Ung ho toi ac truc tiep khi sua luat cho phep trom cuop o muc do <1.000 dollars thi vo toi....Neu vao thoi diem Trump,bon Lua da ho hoan nhu the nao ??? Nhung nguoi bau ban vi chut tu loi ,nghi gi ve dat nuoc ??? Phai chang day khong phai la dat nuoc minh ??? bat qua,lai tro ve que huong cu...Neu vay,ban la thang cho chet ! mien ban !

Xem Thêm

Đề bài :Tin Mới Nhất Về Chiến Sư Ucraina [ CẬP NHẬT NGÀY 14-5-2022 ]

Chung nao moi vet nho cua ho nha Dan da duoc tay xoa trang boc,thi Uk moi co hy vong...ngung chien.Cung vay,ngay nao ma cac cong ty ,co goc gac tu cac dang bac nu luu-anh hao cua khoi tu do va ong chief police va dang Lua thi moi giai xong phuong trinh tau cong !

Xem Thêm

Đề bài :Người Việt Nam Nghĩ Gì? -Từ Đức Minh ( Trần Văn Giang ghi lại )

Nhan dinh cua saigonpots ma bac Tran van Giang ghi lai.Doc xong nghe cay dang nao long.Du su that no ranh ranh.Nhung tuoi gia cung co mot hy vong cho du la mong manh va mo ao. hy vong con hon la that vong ?

Xem Thêm

Đề bài :Người Việt Nam Nghĩ Gì? -Từ Đức Minh ( Trần Văn Giang ghi lại )

Nhan dinh cua saigonpots ma bac Tran van Giang ghi lai.Doc xong nghe cay dang nao long.Du su that no ranh ranh.Nhung tuoi gia cung co mot hy vong cho du la mong manh va mo ao. hy vong con hon la that vong ?

Xem Thêm

Đề bài :Hình cũ - Hà Thượng Thủ

Ngắm lại hình xưa chịu mấy ông Những Linh, Tùng, Duẫn với Mười, Đồng Mặt mày ai lại đi hồ hởi Phấn khởi khi Tàu cướp Biển Đông Phải chăng “quý” mặt đã thành mông Con mắt nay đà có nhưng không Nên mới chổng khu vào hải đảo Gia tài gấm vóc của tổ tông?

Xem Thêm

Đề bài :Nói thật - Hà Thượng Thủ

Loi tuyen bo cua Bo truong han la phai dung ! Vay ra tu truoc toi nay,bang gia- hoc gia- tu nghiep gia...tat ca deu gia. Vay cai gi la that ?chang phai duoi che do CS,tat ca deu la gia tra,.gian doi,lua dao...Tat ca deu da duoc dao tao bang lao toet ngay tu khi con la thieu nhi .

Xem Thêm

Đề bài :Nói thật - Hà Thượng Thủ

Loi tuyen bo cua Bo truong han la phai dung ! Vay ra tu truoc toi nay,bang gia- hoc gia- tu nghiep gia...tat ca deu gia. Vay cai gi la that ?chang phai duoi che do CS,tat ca deu la gia tra,.gian doi,lua dao...Tat ca deu da duoc dao tao bang lao toet ngay tu khi con la thieu nhi .

Xem Thêm

Đề bài :Nói thật - Hà Thượng Thủ

Loi tuyen bo cua Bo truong han la phai dung ! Vay ra tu truoc toi nay,bang gia- hoc gia- tu nghiep gia...tat ca deu gia. Vay cai gi la that ?chang phai duoi che do CS,tat ca deu la gia tra,.gian doi,lua dao...Tat ca deu da duoc dao tao bang lao toet ngay tu khi con la thieu nhi .

Xem Thêm