Google vừa cập nhật một tính năng mang tính đột phá cho ứng dụng Gemini AI: khả năng tải lên và phân tích video cá nhân. Theo Neowin, đây là một trong những bản cập nhật đáng giá nhất của Gemini kể từ khi ra mắt, đưa công cụ này đến gần hơn với vai trò của một trợ lý AI đa phương tiện thực thụ.
Mục lục
Gemini AI đã có thể xem và hiểu video người dùng tải lên
Trước đây, Gemini chủ yếu hỗ trợ xử lý văn bản, hình ảnh và liên kết YouTube. Giờ đây, người dùng có thể tải trực tiếp video từ thư viện điện thoại lên Gemini, sau đó đặt câu hỏi về nội dung bên trong video đó. Tính năng này cho phép Gemini “xem” video như con người và phản hồi lại với độ chính xác ấn tượng. Đây là bước tiến lớn trong việc giúp AI hiểu môi trường thực tế, vượt xa khả năng nhận diện hình ảnh thông thường.

Ví dụ thực tế về khả năng phân tích video
- Nhận diện chi tiết trong khung hình: Một người dùng đã tải lên video có hiển thị đồng hồ Nest Hub và hỏi Gemini về thời gian trong clip. AI đã trả lời chính xác giờ đang hiển thị.
- Mô tả cảm xúc và bối cảnh: Với video quay cảnh rừng mùa thu, Gemini đưa ra đoạn mô tả chi tiết và mang tính cảm xúc cao:
“Đây có vẻ là một khung cảnh yên bình từ một khu rừng vào mùa thu. Một con đường mòn hẹp, phủ đầy lá rụng với các sắc thái cam, nâu và vàng… Ánh nắng mặt trời len lỏi qua các cành cây, tạo ra ánh sáng và bóng đổ lốm đốm… Có một không khí thanh bình và yên tĩnh, hoàn hảo cho một cuộc dạo bộ.”
Điều này chứng minh Gemini không chỉ nhận diện đối tượng, mà còn có khả năng hiểu ngữ cảnh, không khí và cảm xúc trong video — điều mà chỉ những AI đa mô thức tiên tiến mới có thể thực hiện.
:quality(75)/ung_dung_gemini_bo_sung_tinh_nang_tai_len_va_phan_tich_video_1_d821ee8dc1.jpg)
Cách kiểm tra tài khoản Gemini đã có tính năng phân tích video
Tính năng này hiện đang được Google phát hành theo từng đợt, áp dụng cho cả người dùng miễn phí và trả phí trên Android (thông qua ứng dụng Google beta) và iOS. Tuy nhiên, phiên bản web vẫn chưa được hỗ trợ.
Để kiểm tra xem tài khoản của bạn đã được cập nhật hay chưa, làm theo các bước sau:
- Mở ứng dụng Gemini trên điện thoại.
- Nhấn biểu tượng dấu cộng (+) để thêm tệp.
- Chọn Thư viện (Gallery) hoặc Tệp (Files).
- Nếu có thể chọn tệp video (không bị làm mờ), bạn đã có quyền truy cập tính năng mới.
Gemini đang tiến gần hơn đến vai trò của một trợ lý AI toàn năng
Việc Google bổ sung khả năng phân tích video cá nhân cho thấy nỗ lực không ngừng trong việc nâng cao trải nghiệm người dùng, giúp Gemini hiểu thế giới một cách trực quan và toàn diện hơn. Trong tương lai, người dùng có thể kỳ vọng vào những ứng dụng AI mạnh mẽ hơn, hỗ trợ giải thích video học tập, hướng dẫn thao tác kỹ thuật, hoặc phân tích nội dung clip cá nhân một cách thông minh, tự nhiên như một con người thực sự.



