Thứ Bảy, Tháng Mười Hai 6, 2025
spot_img
Trang chủAIGoogle nâng cấp Gemini với tính năng được chờ đợi từ lâu

Google nâng cấp Gemini với tính năng được chờ đợi từ lâu

Kể từ khi chính thức ra mắt vào năm 2023, Google Gemini đã nhanh chóng trở thành một trong những chatbot AI được chú ý nhiều nhất trên thị trường. Với mục tiêu cạnh tranh trực tiếp cùng ChatGPT và các công cụ AI khác, Google liên tục cập nhật và cải tiến Gemini để đáp ứng nhu cầu ngày càng đa dạng của người dùng. Mới đây, Google đã tung ra một nâng cấp được mong chờ từ lâu: khả năng tải lên và xử lý tệp âm thanh trực tiếp trên ứng dụng Gemini.

Tính năng mới của Gemini: tải lên và phiên âm tệp âm thanh

Theo chia sẻ của ông Josh Woodward – Phó chủ tịch Google, hỗ trợ âm thanh chính là “yêu cầu số 1” từ cộng đồng người dùng Gemini. Với bản cập nhật này, người dùng có thể:

  • Tải lên tối đa 10 tệp âm thanh cùng lúc.
  • Tổng thời lượng các tệp không vượt quá 10 phút.
  • Nhận về phiên âm văn bản chính xác, tóm tắt nội dung hoặc trích xuất thông tin chỉ với một nút bấm.

Điều này đặc biệt hữu ích trong nhiều tình huống thực tế như: ghi âm buổi họp, hội thảo, phỏng vấn hay thậm chí là ghi chú cá nhân. Người dùng chỉ cần tải file âm thanh lên và Gemini sẽ nhanh chóng chuyển đổi sang văn bản, giúp tiết kiệm thời gian và công sức.

Google nâng cấp Gemini với tính năng được chờ đợi từ lâu - Ảnh 1.

Triển khai dần trên Android, iOS và web

Hiện tại, tính năng tải lên âm thanh đã được triển khai trên Android, iOS và phiên bản web của Gemini. Tuy nhiên, Google cho biết bản cập nhật này sẽ được phát hành theo từng giai đoạn, do đó không phải tất cả người dùng đều đã có thể trải nghiệm ngay lập tức. Nếu muốn thử, bạn có thể tải lên một tệp âm thanh bất kỳ và ra lệnh cho Gemini xử lý. Trong trường hợp ứng dụng chưa hỗ trợ, hệ thống sẽ hiển thị thông báo không thể xử lý tệp.

Nhiều cải tiến khác của Gemini ngoài hỗ trợ âm thanh

Không chỉ dừng lại ở việc bổ sung tính năng âm thanh, Google cũng đã thực hiện hàng loạt nâng cấp khác cho Gemini. Một số điểm nổi bật gồm:

  • Tùy chọn cá nhân hóa: giúp người dùng tinh chỉnh trải nghiệm AI theo sở thích riêng.
  • Tích hợp Google Finance: cho phép truy cập nhanh thông tin tài chính, chứng khoán.
  • Giao diện thẻ nổi (floating cards): giúp việc tương tác với các đối tượng trên màn hình trở nên trực quan và dễ dàng hơn.
AI for Finance | Google Workspace

Bước tiến quan trọng trong cuộc đua AI

Việc bổ sung tính năng tải lên và xử lý âm thanh cho thấy Google đang lắng nghe nhu cầu thực tế từ người dùng, đồng thời từng bước hoàn thiện hệ sinh thái AI Gemini. Đây cũng là một lợi thế lớn trong bối cảnh thị trường AI ngày càng cạnh tranh gay gắt, khi người dùng không chỉ cần một chatbot trả lời câu hỏi, mà còn muốn một trợ lý ảo toàn diện có thể xử lý văn bản, hình ảnh, âm thanh và nhiều dạng dữ liệu khác.

Có thể thấy, với những cập nhật liên tục, Google Gemini đang dần trở thành công cụ AI không thể thiếu cho học tập, công việc lẫn đời sống hàng ngày.

4.8/5 - (177 votes)
BÀI VIẾT LIÊN QUAN
spot_img

BÀI VIẾT PHỔ BIẾN