Bản cập nhật mới nhất của ChatGPT, tích hợp mô hình o3, đã khiến cộng đồng công nghệ không khỏi ngạc nhiên với khả năng xác định vị trí địa lý của một bức ảnh dựa trên các chi tiết trực quan. Tính năng đột phá này mở ra nhiều tiềm năng ứng dụng nhưng cũng làm dấy lên những lo ngại về quyền riêng tư.
Mục lục
Bước đột phá và khả năng mới của ChatGPT trong nhận thức hình ảnh
Cộng đồng công nghệ đang xôn xao trước tính năng mới được tích hợp trên ChatGPT, cho phép AI này xác định vị trí của ảnh dựa trên các manh mối trực quan. Các chuyên gia đánh giá đây là một bước tiến vượt bậc trong lĩnh vực nhận thức hình ảnh của trí tuệ nhân tạo.

Mô hình mới nhất o3 của OpenAI có khả năng phân tích hình ảnh, thực hiện suy luận trong thời gian ngắn và cung cấp câu trả lời kèm theo lý do dẫn đến kết luận đó. Đặc biệt, mô hình này còn có thể kết hợp khả năng nhận dạng hình ảnh với các thao tác xử lý ảnh phức tạp, chẳng hạn như đọc được chữ viết ngược trên một vật thể trong ảnh.
Cách thức hoạt động và ví dụ về khả năng xác định vị trí ảnh
Để sử dụng tính năng này, người dùng chỉ cần tải ảnh lên và yêu cầu ChatGPT dự đoán vị trí nơi bức ảnh được chụp. ChatGPT sẽ tiến hành quét toàn bộ hình ảnh để nhận diện các chi tiết như biển hiệu, bảng quảng cáo, kiến trúc, cảnh quan thiên nhiên,… Từ đó, AI sẽ đưa ra kết luận về vị trí và thời điểm có thể chụp bức ảnh.

Một ví dụ điển hình là khi người dùng tải lên ảnh chụp tại một thác nước và hỏi ChatGPT: “Bạn đoán nơi này ở đâu?” Chỉ sau vài phút phân tích, ChatGPT o3 đã đưa ra kết quả dự đoán là Water Wheel Falls/ Ellison Creek Cascades, nằm ở phía bắc thị trấn Payson, bang Arizona (Mỹ). AI dựa vào các chi tiết như vách đá granite có rãnh dọc đặc trưng, hồ nước màu xanh ngọc, khúc gỗ lớn nằm ngang trên thác và hệ thực vật vùng Arizona để lập luận. Dù có độ chính xác đáng kinh ngạc, OpenAI vẫn nhấn mạnh rằng khả năng dự đoán sai vẫn có thể xảy ra nếu hình ảnh thiếu thông tin trực quan rõ ràng.
Tiềm năng ứng dụng và những lo ngại về bảo mật
Theo OpenAI, tính năng mới này hứa hẹn mang lại nhiều lợi ích thiết thực, đặc biệt trong các tình huống ứng phó khẩn cấp, ví dụ như hỗ trợ tìm kiếm nạn nhân thông qua hình ảnh hiện trường, hoặc phục vụ cho các mục đích nghiên cứu chuyên sâu. Mặc dù có nhiều tiềm năng hữu ích, sự ra đời của tính năng “đọc vị” vị trí ảnh của ChatGPT cũng làm dấy lên những lo ngại trong cộng đồng người dùng.

Nhiều người lo ngại rằng kẻ xấu có thể lợi dụng khả năng này để thực hiện các hành vi phạm pháp. Thậm chí, một số người dùng còn cho rằng tính năng này mang đến cảm giác “đáng sợ” hơn là hữu ích, đặt ra những thách thức không nhỏ về vấn đề bảo mật và quyền riêng tư trong kỷ nguyên AI ngày càng phát triển.
