Trong bối cảnh các công ty công nghệ đẩy mạnh đầu tư vào AI đa phương tiện, Midjourney – một trong những cái tên nổi bật nhất trong lĩnh vực AI tạo hình ảnh – đã chính thức tham gia thị trường video AI với mô hình đầu tiên mang tên V1. Đây không chỉ là một bản cập nhật sản phẩm, mà còn là bước ngoặt chiến lược đưa Midjourney từ một công cụ tạo ảnh tĩnh trở thành nền tảng sáng tạo nội dung đa phương tiện, cạnh tranh trực tiếp với các đối thủ lớn như OpenAI (Sora), Google (Veo 3), Runway và Adobe Firefly.
Mục lục
Midjourney V1: Từ hình ảnh tĩnh đến video động
Mô hình Midjourney V1 hoạt động theo cơ chế image-to-video. Người dùng có thể tải lên hình ảnh có sẵn hoặc sử dụng hình ảnh được tạo từ các mô hình khác của Midjourney, sau đó V1 sẽ tạo ra 4 video, mỗi video dài 5 giây. Tất cả thao tác hiện tại đều được thực hiện qua nền tảng web hoặc Discord – kênh tương tác quen thuộc với cộng đồng người dùng Midjourney.
Không giống như các công cụ video AI thông thường, Midjourney V1 cho phép mức độ tùy chỉnh cao. Người dùng có thể chọn chế độ chuyển động tự động cho hình ảnh hoặc nhập mô tả bằng văn bản để định hướng chuyển động theo ý muốn. Ngoài ra, mô hình còn hỗ trợ điều chỉnh chuyển động camera và nhân vật, chia theo mức độ thấp (low motion) và cao (high motion), giúp tạo ra hiệu ứng thị giác mượt mà, tự nhiên hơn.

Cạnh tranh bằng trải nghiệm sáng tạo, không chỉ là công cụ sản xuất
Thay vì chỉ phục vụ mục tiêu thương mại như các nền tảng video AI khác, Midjourney tuyên bố họ ưu tiên nhóm người làm sáng tạo – những cá nhân mong muốn tạo ra nội dung độc đáo, mang dấu ấn cá nhân. Theo CEO David Holz, mô hình video mới này là một phần trong chiến lược dài hạn nhằm xây dựng công cụ mô phỏng thế giới mở theo thời gian thực – một mục tiêu đầy tham vọng của Midjourney trong tương lai.
Hiện tại, các video tạo từ V1 có thể kéo dài tối đa 21 giây nếu người dùng chọn gia hạn thêm 4 lần (mỗi lần 4 giây). Đây là thời lượng lý tưởng để tạo các video thử nghiệm, teaser ý tưởng, hoặc thậm chí là các phân đoạn B-roll đầy sáng tạo cho sản phẩm truyền thông cá nhân.
Chi phí sử dụng và lộ trình phát triển của Midjourney V1
So với việc tạo hình ảnh, phí tạo video bằng Midjourney cao gấp 8 lần. Điều này đồng nghĩa với việc người dùng sẽ cần cân nhắc số lượt sử dụng kỹ hơn khi chuyển sang video. Gói Basic giá 10 USD/tháng hiện là cách rẻ nhất để tiếp cận tính năng video. Trong khi đó, các gói Pro (60 USD) và Mega (120 USD) sẽ cho phép tạo video không giới hạn ở chế độ “Relax”.
Midjourney cho biết họ sẽ tiếp tục điều chỉnh mức giá trong tháng tới dựa trên hành vi người dùng và hiệu suất máy chủ, nhằm đảm bảo trải nghiệm ổn định cho cả hình ảnh và video.
Midjourney và tầm nhìn dài hạn
Với V1, Midjourney không chỉ dừng lại ở một mô hình chuyển ảnh thành video, mà còn đặt nền móng cho tham vọng lớn hơn: xây dựng các mô hình AI có khả năng hiểu, mô phỏng và tạo dựng thế giới theo thời gian thực. Điều này mở ra một kỷ nguyên mới cho công cụ sáng tạo – nơi AI không chỉ hỗ trợ, mà còn đồng hành cùng con người trong việc kể chuyện, sản xuất và thiết kế ý tưởng ở cấp độ chưa từng có.
Tương lai của video AI sẽ là một cuộc chơi khốc liệt giữa các ông lớn. Nhưng nếu duy trì được tốc độ đổi mới và khả năng đáp ứng cộng đồng sáng tạo, Midjourney hoàn toàn có thể giữ vững vị thế tiên phong của mình trong làn sóng AI thế hệ mới.



