Trong nhiều năm, các chatbot AI như Gemini hay ChatGPT thường gặp khó khăn khi tạo văn bản bên trong hình ảnh. Những lỗi quen thuộc như ký tự bị méo, nét chữ không đều, chữ tiếng Việt sai dấu… khiến chất lượng ảnh đầu ra chưa đạt kỳ vọng. Tuy nhiên, với mô hình Nano Banana Pro trên Gemini 3 Pro, hạn chế này gần như đã được giải quyết. Khả năng tái tạo chữ viết – đặc biệt là tiếng Việt – đã trở nên sắc nét, tự nhiên và chính xác hơn nhiều.
Trong bài viết này, mình sẽ thử nghiệm hàng loạt yêu cầu liên quan đến giải toán, viết văn, mô phỏng chữ viết tay và chấm bài để kiểm chứng khả năng xử lý văn bản trong ảnh của Nano Banana Pro.
Mục lục
Khả năng xử lý các câu hỏi cơ bản trong Gemini 3 Pro
Ở thử thách đầu tiên, mình yêu cầu Gemini dùng Nano Banana Pro để chứng minh một bài toán dựa trên hệ tiên đề Peano dựa trên ảnh chụp đề bài. Thời gian xử lý dao động từ 30 giây đến 1 phút – mức hoàn toàn chấp nhận được cho một tác vụ tạo ảnh phức tạp.
Kết quả của câu hỏi 1:
Nano Banana Pro tái tạo văn bản cực kỳ sắc nét. Khi mình yêu cầu mô phỏng chữ viết tay, AI tạo ra nét chữ rất tự nhiên, có bố cục rõ ràng và thậm chí tự động gạch chân mục “Lời giải”. Điều này cho thấy mô hình không chỉ hiểu nội dung mà còn hiểu cả quy tắc trình bày bài toán.

Gemini 3 Pro mô phỏng chữ viết tay trên giấy học sinh
Ở thử thách thứ hai, mình nâng độ khó bằng cách yêu cầu AI chép câu hỏi hóa học bằng chữ viết tay rồi giải phía dưới, tất cả nằm trong một bức ảnh.
Kết quả của câu hỏi 2:
Gemini chủ động điều chỉnh màu giấy và bối cảnh để làm nổi bật nội dung. Các ký hiệu hóa học, phương trình, chỉ số nhỏ… đều rõ ràng, chính xác. Đây là điểm mà nhiều mô hình AI trước đây thường thất bại.

Giải toán hình học có hình vẽ và lời giải
Ở thử thách thứ ba, mình yêu cầu AI vừa vẽ hình minh họa, vừa viết lời giải bên dưới đề bài, sử dụng chữ viết tay màu đen.
Kết quả của câu hỏi 3:
Gemini trình bày khoa học: lời giải bên trái – hình vẽ bên phải. Các ký hiệu hình học như góc, đoạn thẳng, dấu vuông góc, số đo… đều sắc nét. Hình vẽ hoàn toàn đúng theo dữ kiện.
Điều này cho thấy Nano Banana Pro xử lý cả text lẫn hình học rất mượt.

Tầm quan trọng của prompt khi tạo văn bản trong ảnh
Ở thử nghiệm tiếp theo (câu hỏi 4), mình cố tình giảm bớt yêu cầu, chỉ nói “giải bài toán trong hình ảnh”. Kết quả trả về vẫn đúng nhưng bố cục và font chữ thay đổi.
Điều này chứng minh:
Prompt càng chi tiết, ảnh đầu ra càng đúng ý.

Gemini 3 Pro xử lý bài văn: đẹp nhưng hơi “máy móc”
Ở thử thách thứ năm, mình yêu cầu AI đóng vai học sinh lớp 9, viết đoạn cảm thụ văn học bằng chữ viết tay.
Kết quả của câu hỏi 5:
Chữ viết tay rất đẹp nhưng nếu quan sát kỹ sẽ thấy hơi “đều”, vì các ký tự giống nhau được lặp lại gần như y hệt. Dù vậy, với người dùng phổ thông, điều này rất khó phát hiện.

Chấm điểm và nhận xét bằng chữ viết tay màu đỏ
Thử thách khó nhất: mình yêu cầu Gemini đóng vai giáo viên, chấm điểm và nhận xét bài làm học sinh trực tiếp trên ảnh, dùng chữ đỏ.
Kết quả của câu hỏi 6:
Gemini nhận diện lỗi rất tốt, chấm điểm theo đúng barem và viết nhận xét rõ ràng, tự nhiên như giáo viên thật. Đây là bước tiến rất lớn vì trước đây AI hầu như không thể xử lý chữ viết xấu hay chồng lớp thông tin trên ảnh có sẵn.

Chất lượng ảnh đầu ra được nâng cấp mạnh
Các ảnh tạo bởi Nano Banana Pro có độ phân giải từ 1.000–3.000 pixels, sắc nét hơn hẳn so với những mô hình AI đời cũ (thường chỉ vài trăm pixel). Điều này giúp phóng to không bị vỡ hình.
Một vài hạn chế cần biết
Dù mạnh, Nano Banana Pro vẫn có giới hạn:
- Các tác vụ yêu cầu tương tác trực tiếp lên văn bản có sẵn (như khoanh tròn A/B/C/D) đôi khi bị lỗi.
- Chữ viết tay tuy đẹp nhưng vẫn mang hơi hướng “font” hơn là viết tay thật.
- Prompt không rõ ràng có thể khiến bố cục thay đổi ngoài ý muốn.

Lời khuyên dành cho người dùng
Nano Banana Pro rất phù hợp cho:
- tạo tài liệu minh họa cho bài giảng
- mô phỏng chữ viết tay
- hướng dẫn học sinh bằng hình ảnh
- giải thích bài làm trực quan hơn
Tuy nhiên, học sinh chỉ nên coi đây là công cụ hỗ trợ. Việc lạm dụng AI để làm bài hoặc thi cử có thể khiến kỹ năng tư duy và kiến thức bị ảnh hưởng lâu dài.



