Zalo AI tạo kỳ tích khi huấn luyện mô hình ngôn ngữ lớn (LLM) tiếng Việt từ đầu chỉ trong 6 tháng, vượt qua nhiều “ông lớn” như GPT-4, khẳng định vị thế Việt Nam trên bản đồ AI thế giới.
Mục lục
Bước ngoặt AI Việt Nam: Zalo huấn luyện thành công LLM trong 6 tháng
Tháng 6/2023 đánh dấu cột mốc quan trọng khi Zalo công bố hoàn tất quá trình huấn luyện mô hình ngôn ngữ lớn (LLM) tiếng Việt chỉ trong 6 tháng, nhanh gấp ba lần kế hoạch ban đầu. Đây là mô hình được huấn luyện hoàn toàn từ đầu (from scratch), không sử dụng nền tảng của các LLM có sẵn – một quyết định táo bạo và đầy thách thức trong bối cảnh tài nguyên còn hạn chế tại Việt Nam.
Không chỉ vậy, mô hình LLM 7 tỷ tham số của Zalo đã đạt 150% năng lực so với GPT-3.5 của OpenAI trên bộ đánh giá VMLU – tiêu chuẩn đo lường năng lực LLM tiếng Việt. Bước sang năm 2024, phiên bản 13 tỷ tham số tiếp tục vượt qua hàng loạt tên tuổi lớn như GPT-4, Google Gemma hay Microsoft Phi-3, chỉ xếp sau Llama-3-70B của Meta.

Vì sao mô hình LLM của Zalo đặc biệt?
Tự huấn luyện từ đầu, kiểm soát toàn diện
Thay vì đi theo xu hướng tinh chỉnh (fine-tune) mô hình sẵn có – giải pháp được phần lớn doanh nghiệp lựa chọn vì tiết kiệm chi phí, Zalo chọn cách tự xây dựng từ đầu. Điều này cho phép kiểm soát hoàn toàn mô hình, thuật toán, dữ liệu và tối ưu riêng cho ngôn ngữ tiếng Việt.
Tối ưu trên GPU dân dụng, vượt giới hạn hạ tầng
Do thiếu thiết bị chuyên dụng như các hệ thống GPU cao cấp từ Nvidia, Zalo đã tận dụng GPU dân dụng nhỏ, kết hợp thực nghiệm linh hoạt để tích lũy kinh nghiệm và đẩy nhanh tiến độ huấn luyện. Dù đã đặt mua 8 máy chủ DGX H100, nhưng do khan hiếm chip AI, quá trình nhận thiết bị phải chia theo nhiều đợt.
Dữ liệu tiếng Việt chất lượng cao
Zalo đầu tư mạnh vào xây dựng bộ dữ liệu tiếng Việt chất lượng, bù đắp sự thiếu hụt so với các ngôn ngữ như tiếng Anh hay Trung. Điều này đóng vai trò then chốt để mô hình đạt hiệu suất vượt trội trên các bảng xếp hạng đánh giá năng lực.

Ứng dụng thực tế của mô hình AI Zalo
Không dừng ở nghiên cứu, Zalo đã nhanh chóng ứng dụng LLM vào đời sống người Việt thông qua những sản phẩm cụ thể:
Kiki Info – Trợ lý AI cho người Việt
Ra mắt đầu 2025, Kiki Info là trợ lý AI tổng hợp trên nền tảng Zalo OA, hỗ trợ hỏi đáp kiến thức, giải trí và sáng tạo nội dung. Chỉ trong chưa đầy 2 tháng, Kiki Info đã thu hút 1 triệu lượt truy cập, chứng minh tiềm năng phổ cập AI trong cộng đồng.

Thiệp AI – Kết nối cảm xúc bằng công nghệ
Ứng dụng thiệp AI của Zalo nhanh chóng “gây sốt” với 15 triệu thiệp được tạo ra và gửi đi trong 2 tháng, đặc biệt trong các dịp lễ tết. Đây là minh chứng cho sự gần gũi, nhân văn trong cách Zalo đưa công nghệ vào đời sống người dùng.
Vượt khó để khẳng định tầm vóc
Tiến sĩ Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI, chia sẻ rằng đội ngũ kỹ sư Việt Nam gặp nhiều khó khăn khi bước vào lĩnh vực AI: thiếu hạ tầng, thiếu dữ liệu, thiếu kinh nghiệm. Tuy nhiên, với quyết tâm và chiến lược phù hợp, Zalo không chỉ làm chủ công nghệ mà còn khẳng định năng lực sáng tạo, đưa Việt Nam vào bản đồ AI khu vực Đông Nam Á.
Với thành công trong huấn luyện và ứng dụng thực tế, Zalo AI đang tiếp tục phát triển các mô hình mạnh hơn, thông minh hơn, hướng đến chuẩn quốc tế. Đây là tín hiệu tích cực cho hệ sinh thái AI tại Việt Nam, khơi dậy động lực nghiên cứu trong cộng đồng công nghệ nội địa.



