Google giới thiệu thiết bị dịch mang tính cách mạng có thể trực tiếp lồng tiếng khớp cử động môi

Trong hội nghị thường niên của Google, Google I/O ’23, James Manyika, Phó chủ tịch cấp cao về Công nghệ và Xã hội, đã giới thiệu một bước phát triển mới thú vị trong công nghệ lồng tiếng—Universal Translator. Dịch vụ lồng tiếng video AI thử nghiệm này nhằm mục đích cách mạng hóa quy trình lồng tiếng bằng cách dịch liền mạch giọng nói của người nói đồng thời khớp với cử động môi của họ.

Manyika giải thích rằng Universal Translator sử dụng các mô hình dịch tiên tiến để diễn giải các từ của người nói, sao chép phong cách và giọng điệu của họ cũng như đồng bộ hóa chuyển động môi của họ. Kết quả là một video clip trong đó giọng nói của người nói được lồng tiếng bằng một ngôn ngữ khác trong khi môi của họ dường như chuyển động hoàn hảo với các từ được dịch.

Để giải quyết những lo ngại về khả năng sử dụng sai mục đích, Google đã triển khai các biện pháp bảo vệ. Manyika đã cho biết dịch vụ này có “lan can” tích hợp và đang trong quá trình kết hợp các watermark để chống lại thông tin sai lệch. Hiện tại, quyền truy cập vào Universal Translator mới chỉ được giới hạn cho các đối tác được ủy quyền.

Phần trình diễn tại sự kiện đã giới thiệu các khả năng của Universal Translator bằng cách phát một đoạn clip từ một khóa học đại học trực tuyến, đầu tiên là phiên bản gốc tiếng Anh và sau đó được lồng tiếng Tây Ban Nha. Người xem đã rất ấn tượng khi chứng kiến môi của người nói chuyển động liền mạch với phần lời được dịch trực tiếp, khiến người xem có được trải ngiệm sống động như đang nghe đoạn hội thoại được nói bởi ngôn ngữ gốc.

Mặc dù có nhiều suy đoán về tiềm năng sử dụng dịch vụ này chẳng hạn như dùng cho YouTube, chúng ta vẫn còn phải chờ xem liệu các giải pháp hiện có, chẳng hạn như dịch vụ lồng tiếng mới ra mắt của YouTuber nổi danh MrBeast, sẽ hoạt động với tư cách là các giải pháp thay thế tạm thời cho đến khi Universal Translator chính thức ra mắt công chúng hay sẽ là đối thủ cạnh tranh trực tiếp.

Universal Translator của Google là kết quả tiếp nối báo cáo nghiên cứu “Dịch nói không văn bản” được công bố vào tháng 10 năm . Tuy nhiên, Google không đơn độc trong việc theo đuổi mục tiêu này. Các công ty khác như AppTek và các đối thủ cạnh tranh của Google, bao gồm cả Amazon, cũng đang tích cực phát triển công nghệ lồng tiếng tự động hoặc công nghệ lồng tiếng bằng AI. Tiến bộ đáng chú ý nhất của Universal Translator là khả năng khớp môi rất ấn tượng.

Tiềm năng của Universal Translator là vô cùng lớn. Nó có thể vượt qua các rào cản ngôn ngữ, làm cho nội dung giáo dục, các khóa học trực tuyến và các hình thức truyền thông khác nhau dễ tiếp cận hơn với khán giả toàn cầu. Hơn nữa, ứng dụng của nó còn vượt ra ngoài lĩnh vực giải trí, mang đến những khả năng quan trọng trong lĩnh vực kinh doanh quốc tế, ngoại giao và giao tiếp liên văn hóa.

Tuy nhiên khi Universal Translator phát triển và hoàn thiện hơn nữa, những vấn đề về đạo đức cũng cần phải được đặc biệt lưu ý và cẩn trọng. Mặc dù lợi ích về khả năng tiếp cận của nó là không thể phủ nhận, nhưng nhà sản xuất cũng cần phải có các biện pháp ngăn chặn việc lạm dụng công nghệ này, chẳng hạn như tạo deepfake.

Với cam kết của Google về AI có trách nhiệm và những tiến bộ không ngừng trong công nghệ lồng tiếng, Universal Translator thể hiện một bước tiến đáng kể trong việc phá bỏ rào cản ngôn ngữ và thúc đẩy giao tiếp đa văn hóa. Khi nó phát triển, sự đổi mới đột phá này có khả năng định hình lại cách chúng ta tiêu thụ và tương tác với phương tiện truyền thông, đưa chúng ta đến gần hơn với một thế giới thực sự kết nối với nhau.

Phần mềm Microsoft Office 365 Personal | 1 người dùng 5 thiết bị | 1 TB Onedrive
Phần mềm Microsoft 365 Family | 12 tháng | Dành cho 6 người Trọn bộ ứng dụng Office
Combo Phần Mềm Tiếng Anh ELSA Speak Trọn Đời và ELSA Oxford