Sự kiện Google I/O 2025 vừa qua đã trở thành tâm điểm của giới công nghệ khi gã khổng lồ tìm kiếm trình làng hàng loạt cải tiến và sản phẩm AI đột phá. Trí tuệ nhân tạo tiếp tục là trọng tâm với sự ra mắt của các mô hình Gemini 2.5 thế hệ mới, công cụ tạo ảnh Imagen 4 đỉnh cao, công cụ sản xuất video AI Veo 3, và đặc biệt là Flow – nền tảng làm phim AI chuyên nghiệp hứa hẹn thay đổi cục diện ngành giải trí.
Mục lục
Gemini 2.5: Trí tuệ AI đa năng và mạnh mẽ hơn
Gemini 2.5, với hai phiên bản Pro và Flash, được coi là ngôi sao của sự kiện. Google đã mở rộng khả năng hỗ trợ ngôn ngữ lên tới hơn 24 thứ tiếng, đi kèm tính năng chuyển văn bản thành giọng nói tự nhiên và biểu cảm. Cả Gemini 2.5 Flash và Pro đều được tăng cường mạnh mẽ về khả năng suy luận, xử lý đa phương thức, viết mã và đặc biệt là năng lực hiểu ngữ cảnh dài.
Một trong những cập nhật đáng chú ý trên phiên bản Pro là chế độ suy luận ‘Deep Think‘ dành riêng cho các bài toán và tác vụ lập trình siêu phức tạp. Dù vẫn trong giai đoạn thử nghiệm, Deep Think được kỳ vọng sẽ cho phép AI cân nhắc nhiều giả thuyết khác nhau trước khi đưa ra câu trả lời cuối cùng.

Hiện tại, Gemini 2.5 Pro đã vươn lên dẫn đầu trên các bảng xếp hạng uy tín như WebDev Arena và LMArena, cung cấp công cụ xây dựng ứng dụng web và viết mã tiên tiến cùng cửa sổ ngữ cảnh lên đến 1 triệu token. Khả năng bảo mật chống lại các cuộc tấn công prompt gián tiếp cũng được cải thiện đáng kể.
Người dùng có thể trải nghiệm trước Gemini 2.5 Flash ngay trong ứng dụng Gemini, với bản phát hành rộng rãi dự kiến vào cuối tháng 6. Phiên bản thương mại của Gemini 2.5 Pro cũng sẽ sớm nối gót.
Imagen 4 và Veo 3: Sáng tạo hình ảnh và video vượt trội
Không chỉ Gemini, Google còn nâng cấp mạnh mẽ các công cụ đa phương tiện. Imagen 4 nay có thể xuất hình ảnh độ phân giải 2K và cải thiện đáng kể độ chính xác văn bản trong đồ họa. Imagen 4 đã có mặt trên Gemini, Google Workspace, Whisk và Vertex AI.

Trong khi đó, Veo 3, mô hình video AI mới nhất, gây ấn tượng với khả năng chuyển đổi văn bản thành video chân thực, hoàn chỉnh cả âm thanh, lời thoại và tiếng động nền. Veo 3 đã được cung cấp cho người đăng ký Google AI Ultra và người dùng doanh nghiệp Vertex AI từ 20/5. Veo 2 cũng nhận cập nhật với các tính năng điều khiển chuyển động máy quay và mở rộng khung hình.
Flow: Công cụ làm phim AI chuyên nghiệp định hình tương lai điện ảnh
Đặc biệt, Google đã vén màn Flow, một công cụ làm phim AI chuyên dụng đầy tham vọng. Flow kết hợp sức mạnh của các mô hình Veo, Imagen và Lyria, cho phép người dùng tạo ra những cảnh quay điện ảnh với độ chi tiết và tính chân thực vật lý đáng kinh ngạc, chỉ từ những câu lệnh văn bản đơn giản.
Với Flow, người dùng có toàn quyền kiểm soát chuyển động máy quay, góc độ và phối cảnh, cũng như chỉnh sửa và mở rộng các video đã tạo. Google Flow hiện đã được cung cấp cho người dùng đăng ký Google AI Pro và Ultra tại Mỹ, mở ra một kỷ nguyên mới cho các nhà sáng tạo nội dung và nhà làm phim.

Nhìn chung, Google I/O 2025 đã cho thấy cam kết mạnh mẽ của Google trong việc phát triển AI, từ những mô hình ngôn ngữ tiên tiến đến các công cụ sáng tạo đa phương tiện chuyên nghiệp. Những sản phẩm này không chỉ nâng cao trải nghiệm người dùng mà còn định hình tương lai của nhiều ngành công nghiệp khác nhau.



