Lý do nào giúp Google Dịch có thể hỗ trợ nhiều loại ngôn ngữ đến thế?

Vừa qua, Google Dịch đã tiến hành lần cập nhật mở rộng được coi là lớn nhất từ trước đến nay khi hỗ trợ thêm 110 ngôn ngữ mới, từ đó nâng tổng số ngôn ngữ lên con số 243.

Được biết, một số ngôn ngữ mới hỗ trợ gồm tiếng Quảng Đông, tiếng Afar, tiếng Manx, NKo, tiếng Punjabi, Tamazight và Tok Pisin.

Google cho biết, 110 ngôn ngữ mới thêm vào là đại diện cho hơn 614 triệu người nói, mở ra khả năng dịch thuật cho khoảng 8% dân số thế giới. Bên cạnh đó, một vài trong số này là sử dụng ngôn ngữ lớn trên thế giới với hơn 100 triệu người nói.

google-dich-va-docjpg-1719993414.webp
Google Dịch vừa hỗ trợ thêm 110 ngôn ngữ mới, nâng tổng số ngôn ngữ lên con số 243

Google cũng nhấn mạnh, ¼ trong số 110 ngôn ngữ mới đến từ Châu Phi. Đồng thời, đây cũng là bản cập nhật lớn nhất của Google Dịch cho cư dân lục địa này. Hiện tại, với 243 ngôn ngữ, số cặp dịch của Google Dịch đã lên tới 29.403.

Nguyên nhân Google đạt được thành tích này là do có sự trợ giúp của mô hình ngôn ngữ lớn PaLM2.

PaLM là mô hình ngôn ngữ Pathways, viết đầy đủ là Pathways Language Model, được sử dụng kiến trúc Pathways AI của Google giúp đào tạo các mô hình học máy để thực hiện nhiều nhiệm vụ khác nhau. Ngoài ra, mô hình này cũng được đánh giá là một phần quan trọng ở hành trình hiện thực tầm nhìn của Google trong việc nỗ lực đạt được mục tiêu AI là thực hiện được mọi tác vụ tư duy của con người.

20230613-h29-1719993607.png
Mô hình ngôn ngữ lớn PaLM2 giúp Google Dịch hỗ trợ nhiều loại ngôn ngữ khác nhau

Trước đó, Google đã tuyên bố kiến trúc Pathways sẽ mở đường cho AI đa phương thức ngoài văn bản. Điển hình như Gemini là một LLM khác đã đạt được mục tiêu này.

Trong một bài đăng trên blog, Google cho biết: Pathways có thể kích hoạt các mô hình đa phương thức và hiểu biết về thị giác, thính giác và ngôn ngữ cùng lúc. Bởi vậy, kết quả sẽ là một mô hình sâu sắc hơn, ít mắc sai lầm và thành kiến hơn.

Khác với mô hình LaMDA đã bị thay thế, PaLM 2 được đào tạo về hơn 100 ngôn ngữ và thậm chí còn có kiến thức ngành tốt hơn trong các lĩnh vực như coding. Ngoài ra, PaLM 2 còn có khả năng suy luận logic và toán học tốt hơn nhiều.

Google khẳng định: PaLM 2 được đào tạo trên khối lượng lớn văn bản đa ngôn ngữ song song, có thể học và phiên dịch các ngôn ngữ nhanh hơn bởi khả năng logic, đặc biệt là những ngôn ngữ có liên kết chặt chẽ với nhau.

Trong tương lai, Google đặt mục tiêu hỗ trợ 1.000 ngôn ngữ được sử dụng rộng rãi nhất trên toàn cầu để giảm bớt rào cản về ngôn ngữ và thúc đẩy kết nối cộng đồng.

Google Dịch được ra mắt vào năm 2006. Đây là công cụ dịch thuật trực tuyến do Google phát triển. Google Dịch cung cấp giao diện trang web, ứng dụng trên di động cho hệ điều hành Android và iOS, giao diện lập trình ứng dụng có thể giúp các nhà phát triển xây dựng tiện ích mở rộng trình duyệt web và ứng dụng phần mềm. Từ đó đến nay, công ty đã dần bổ sung cho nhiều loại ngôn ngữ trên nền tảng này.

Khi so sánh với các công cụ khác cùng lĩnh vực thì Google Dịch đang giữ thế thượng phong và bỏ xa đối thủ như Apple Translate hiện chỉ hỗ trợ khoảng 20 ngôn ngữ hay Microsoft Translate có khả năng hỗ trợ 135 ngôn ngữ.