Ngày 18/8, tại Thành phố Hồ Chí Minh, Trung tâm Đổi mới sáng tạo Quốc gia thuộc Bộ Kế hoạch và Đầu tư, phối hợp với các đơn vị liên quan tổ chức Hội nghị Trí tuệ nhân tạo - GenAI Summit 2024 với chủ đề “Chân trời mới.”
Tại Hội nghị, nhiều chuyên gia cho rằng trí tuệ nhân tạo (AI) là một lĩnh vực công nghệ nền tảng của cách mạng công nghiệp lần thứ tư, góp phần quan trọng tạo bước phát triển đột phá về năng lực sản xuất, nâng cao năng lực cạnh tranh quốc gia.
Ông Jeff Dean, Giám đốc Khoa học của Google, cho biết Gemini 1.5 Pro (hạ tầng AI cách mạng của Google) đã xuất sắc trong việc xử lý các ngữ cảnh dữ liệu rộng lớn bao gồm văn bản, âm thanh, hình ảnh và video. Theo đó, nếu trong giai đoạn đầu, máy tính được sử dụng để mã hóa và chuyển đổi từ văn bản, hình ảnh sang định dạng mà máy tính có thể hiểu và diễn tả cho người dùng thì trong những năm gần đây, cùng với sự phát triển bùng nổ của mô hình ngôn ngữ lớn, những yêu cầu của người dùng được chuyển đổi thành hình ảnh, âm thanh mà người dùng muốn sử dụng, ngược lại với giai đoạn trước đây.
Bên cạnh việc chuyển đổi ngược, mô hình ngôn ngữ lớn cũng tăng độ chính xác về xử lý dữ liệu và giảm mức độ lỗi khi chuyển đổi từ giọng nói sang văn bản từ 13,25% về 2,5%. Về khả năng xử lý dữ liệu lớn của mô hình ngôn ngữ lớn, ông Jeff Dean cho hay, công ty liên tục cải thiện Google dịch khi không chỉ dịch từ mà còn dự đoán được từ tiếp theo.
Hiện, Google dịch bên cạnh việc dịch còn có thể áp dụng cho các cuộc hội thoại, máy tính sẽ dự báo câu tiếp theo cho người dùng với độ chính xác ngày một cao. “Mô hình ngôn ngữ lớn giúp con người có thể chuyển dữ liệu lớn từ văn bản hàng trăm trang, video dài để tạo ra văn bản giúp ích cho người khiếm thính, người không biết chữ có thể xem được nội dung… Đây cũng là điều mà 10 năm trước đây không ai nghĩ máy tính sẽ làm được,” Giám đốc Khoa học của Google nói.
Đăng thảo luận