Phiên bản ChatGPT mới GPT-4o tương tác qua văn bản và hình ảnh, giao tiếp bằng giọng nói tự nhiên giống người

Sáng 14-5 (giờ Việt Nam), Công ty OpenAI của Mỹ đã ra mắt GPT-4o - phiên bản phần mềm trí tuệ nhân tạo (AI) ChatGPT mới, có khả năng tương tác qua văn bản và hình ảnh, đồng thời trò chuyện bằng giọng nói.

Một người bạn, thấu cảm xúc người dùng

Kể từ khi ra đời vào cuối năm 2022, trải qua nhiều lần nâng cấp, ChatGPT đang phổ biến các phiên bản ChatGPT3.5; ChatGPT 4 (Plus) nhằm hỗ trợ người dùng xử lý các công việc trong cuộc sống hằng ngày thông qua việc nhập liệu những nội dung cần hỏi để nhận kết quả.

Phiên bản GPT-3.5 đang được người dùng sử dụng nhiều nhất do miễn phí, với các tính năng năng xử lý ấn tượng như viết nhanh bài phát biểu trôi chảy, giải những bài tập toán với độ chính xác cao, phân tích dữ liệu đầy đủ thông tin… Đây là công việc vốn dĩ người dùng phải bỏ ra hàng giờ, thậm chí nhiều ngày mới có thể hoàn thành. Với GPT-4, phiên bản trả phí 20 USD/tháng (tương đương 500.000 đồng), vượt trội so với GPT-3.5, được người dùng đánh giá "siêu thông minh" nhờ những tính năng: đọc hiểu văn bản, phân tích và xử lý các tệp tính đính kèm dưới dạng Excel, PDF; phân tích chỉnh sửa hình ảnh bằng câu lệnh AI; vẽ hình ảnh trực tiếp với AI; vẽ biểu đồ và các nhiệm vụ phức tạp khác trong 1 lần thực hiện nhiệm vụ…

Hai phiên bản này đã làm hài lòng và thu hút hàng trăm triệu người dùng. Nhằm mang lại thêm nhiều tiện ích, trải nghiệm cho người dùng, OpenAI gây bất ngờ khi cho ra mắt mô hình mới có tên GPT-4o ("o" có nghĩa là toàn năng "omni"). Theo đó, người dùng được sử dụng miễn phí phiên bản mới nhất và trả phí sẽ được sử dụng với tần suất gấp 5 lần. Điểm nổi bật của GPT-4o là giao diện tương tác tự nhiên và dễ sử dụng hơn nhiều so với mô hình GPT-4. Ở phiên bản mới, ứng dụng có khả năng ghi nhớ ngữ cảnh cuộc hội thoại, học hỏi từ các cuộc tương tác trước đó với người dùng và dịch thuật đa ngôn ngữ theo thời gian thực. GPT-4o tăng khả năng tương tác qua văn bản và hình ảnh, đồng thời trò chuyện bằng giọng nói.

Ngoài ra, ChatGPT phiên bản mới có thể giao tiếp bằng giọng nói tự nhiên giống người hay giọng robot, thậm chí hát một đoạn nào đó trong câu trả lời. Bên cạnh đó, còn có khả năng nhận diện cảm xúc của người dùng: lắng nghe nhịp thở, đề nghị khuyên người dùng bình tĩnh giải quyết công việc. Đáng chú ý, công cụ này còn có thể phân tích hình ảnh biểu đồ và thảo luận dựa trên những thông tin do người dùng cung cấp. Đặc biệt hơn, được tích hợp tính năng dịch thuật và trả lời tự động, phiên bản này hỗ trợ người dùng trò chuyện đa ngôn ngữ (hơn 50 ngôn ngữ) trong thời gian thực. Với tính năng này, công cụ xóa bỏ rào cản về ngôn ngữ, trở thành một người bạn với người dùng, có thể trò chuyện liên tục, không ngắt quãng. Để tăng mức độ tiếp cận người dùng, OpenAI còn tung ra phiên bản máy tính (desktop), máy macOS tích hợp các tính năng của mô hình GPT-4o, mang đến cho người dùng một nền tảng khác để lựa chọn. Theo đó, người dùng đã có thể đặt câu hỏi nhanh bằng phím tắt, trò chuyện bằng giọng nói và thảo luận về ảnh chụp màn hình. Dự kiến, phiên bản dành cho Windows sẽ ra mắt trong năm nay.

Theo một số nguồn tin, phiên bản vượt trội ChatGPT 5 sẽ sớm ra mắt trong thời gian sắp tới với sự nâng cấp mạnh cả hiệu suất và tính năng. Phiên bản mới này sẽ tập trung vào việc nâng cao khả năng hiểu biết và tương tác tự nhiên, tối ưu bảo mật mang đến trải nghiệm mượt mà hơn cho người dùng.

 Dùng ChatGPT tối ưu, an toàn 第1张

Người dùng có thể sử dụng miễn phí phiên bản GPT-4o và trả phí để được sử dụng với tần suất gấp 5 lầnẢnh: lê Tỉnh

Không nên lơ là bảo mật

Song song với sự phát triển không giới hạn của phần mềm AI như ChatGPT, người dùng cần lưu ý chú ý đến các vấn đề bảo mật liên quan đến dữ liệu cá nhân.

Cụ thể, đặt mật khẩu mạnh với độ dài tối thiểu 12 ký tự và đa dạng các loại ký tự khác nhau cùng các chế độ bảo vệ 2-3 lớp đối với tài khoản và email khôi phục để hạn chế bị mất tài khoản. Bên cạnh đó, trước khi cài đặt các tiện ích mở rộng (extension) của trình duyệt web trên máy tính, cần tìm hiểu kỹ các ứng dụng đó có được phát triển bởi các nhà lập trình uy tín hay không? Đối với các ví điện tử hay tài khoản ngân hàng được sử dụng thanh toán cho phiên bản trả phí như của ChatGPT, người dùng nên sử dụng chế độ "ngắt thẻ" trên internet khi đã thanh toán hoặc chỉ duy trì với số dư vừa đủ nhằm phòng tránh rủi ro tài chính. Không chỉ vậy, khi muốn sử dụng phần mềm AI mới, người dùng cần tìm hiểu kỹ về các đơn vị phát hành, phân phối tài khoản kích hoạt phần mềm AI để tránh bị mất tiền oan khi mua ứng dụng qua mạng.

Ngoài ra, cẩn thận với các liên kết và tệp đính kèm về phần mềm AI mới do người lạ gửi vì có thể trong đường link có chứa mã độc nhằm xâm nhập vào thiết bị, lấy cắp thông tin. Hãy tìm kiếm các phần mềm AI ở các chợ ứng dụng chính quy như App Store, CH Play, GPTs, Chrome Web Store hoặc trực tiếp từ trang chính hãng hay các nhà phân phối bán hàng uy tín. Cuối cùng, phải bảo đảm mạng internet an toàn, phần mềm trình duyệt và hệ điều hành được cập nhật mới nhất. 

Sớm phát hành Gemini 1.5 Pro

Mới đây, Meta Platforms - công ty mẹ Facebook - đã công bố các phiên bản Llama 3, mô hình sẽ được tích hợp vào trợ lý ảo Meta AI. AI mới này đưa ra so sánh về hiệu suất trên các chủ đề như lập luận, lập trình và viết văn sáng tạo, cho phép người dùng thực hiện mọi thứ trong kho dữ liệu của Meta như tìm công thức nấu ăn, đọc tin tức hoặc tra cứu các truy vấn đơn giản thay vì bị buộc thoát khỏi ứng dụng Instagram, Facebook hoặc WhatsApp. Hồi tháng 3, Google cho biết sẽ sớm phát hành Gemini 1.5 Pro vượt trội Gemini 1.0, có thể thu được 1 giờ video, 11 giờ âm thanh và hơn 30.000 dòng mã thông qua lời nhắc của người dùng. Khi đó, người dùng có thể đưa vào toàn bộ sách, lịch sử vụ việc pháp lý hoặc bất cứ thứ gì họ muốn vào Gemini và sẽ được trả lời các câu hỏi về dữ liệu chính xác.

L.Tỉnh