Thứ Sáu, Tháng Mười Hai 5, 2025
spot_img
Trang chủAIChatGPT Agent: AI mới của OpenAI có thể kiểm soát máy tính

ChatGPT Agent: AI mới của OpenAI có thể kiểm soát máy tính

OpenAI vừa chính thức bước vào cuộc đua “tác nhân AI” (AI Agent) khi ra mắt phiên bản nâng cấp có tên ChatGPT Agent. Đây là một bước tiến lớn, vì công cụ này không chỉ trả lời văn bản như các chatbot trước đây mà còn có khả năng tự hành động trên máy tính như con người, thực hiện các tác vụ phức tạp từ đầu đến cuối.

ChatGPT Agent làm được những gì?

Không còn dừng ở việc trả lời câu hỏi, ChatGPT Agent có thể thực hiện các yêu cầu đa tầng. Trong bản demo của OpenAI, AI đã thực hiện hàng loạt tác vụ phức tạp:

  • Tự lên lịch hẹn hò bằng cách truy cập Google Calendar, kiểm tra thời gian rảnh, tìm và đặt nhà hàng phù hợp.
  • Phân tích ba đối thủ cạnh tranh, thu thập dữ liệu và tự động tạo bản trình chiếu PowerPoint.
  • Tự động hoá các công việc đời thường như đặt chỗ đậu xe cố định mỗi tuần.

Điểm đặc biệt là người dùng chỉ cần nhập yêu cầu bằng ngôn ngữ tự nhiên, Agent sẽ tự suy luận, lập kế hoạch và hành động.

Video giới thiệu về ChatGPT Agent

Công nghệ đứng sau ChatGPT Agent

ChatGPT Agent được xây dựng từ hai công nghệ then chốt:

  • Operator: Giúp AI điều hướng web như một người dùng thực sự.
  • Deep Research: Giúp AI phân tích, tổng hợp và xử lý thông tin chuyên sâu.

Tuy nhiên, ChatGPT Agent còn đi xa hơn khi được cấp quyền sử dụng một máy tính ảo hoàn chỉnh – không chỉ trình duyệt. Công cụ này bao gồm:

  • Giao diện trình duyệt và soạn văn bản.
  • Terminal để chạy mã và xử lý tệp tin.
  • Connectors để kết nối Gmail, GitHub, và các dịch vụ khác.

Với các công cụ này, ChatGPT Agent có thể thao tác trực tiếp trên dữ liệu, hệ thống và ứng dụng – điều mà các AI thông thường chưa từng làm được.

Công nghệ đứng sau ChatGPT Agent

Bảo mật và giới hạn an toàn

OpenAI thừa nhận rủi ro lớn nhất là prompt injection – khi một website độc hại dụ AI làm việc sai trái. Để ngăn chặn điều này, Agent:

  • Phải xin phép người dùng trước khi thực hiện hành động không thể hoàn tác.
  • Có chế độ “Watch Mode” yêu cầu người dùng giám sát khi AI truy cập vào các trang tài chính, nhạy cảm.
  • Chủ động từ chối tác vụ nguy hiểm, đặc biệt là các giao dịch tài chính hoặc yêu cầu nhạy cảm.

Ngoài ra, OpenAI cũng đã áp dụng các biện pháp bảo vệ nghiêm ngặt cho những lĩnh vực rủi ro cao như sinh học, hóa học và an ninh mạng.

OpenAI cũng đã áp dụng các biện pháp bảo vệ nghiêm ngặt cho những lĩnh vực rủi ro cao

Hiệu năng và hạn chế

Trong thử nghiệm, ChatGPT Agent đã vượt qua hiệu suất của con người ở nhiều bài kiểm tra như DSBench (khoa học dữ liệu) và mô hình tài chính. Tuy nhiên, tốc độ thực thi có thể chậm hơn một chút vì ưu tiên độ chính xác và độ tin cậy trong các tác vụ khó.

OpenAI nhấn mạnh: “Đây là công cụ bạn bật lên để làm việc ngầm, sau đó quay lại khi nó hoàn tất nhiệm vụ.”

ChatGPT Agent đã vượt qua hiệu suất của con người ở nhiều bài kiểm tra

Cách sử dụng và lộ trình phát triển

ChatGPT Agent đang được thử nghiệm cho người dùng gói Pro, Plus và Team. Để sử dụng, người dùng có thể chọn “Agent Mode” trong thanh công cụ hoặc gõ lệnh “/agent” trong ChatGPT.

Dự kiến, các tài khoản doanh nghiệp và giáo dục sẽ được tiếp cận trong mùa hè năm nay. Trong tương lai, Agent sẽ tiếp tục được cải tiến để trở nên thông minh, an toàn và toàn năng hơn nữa.

Tạm kết

ChatGPT Agent không chỉ là một sản phẩm mới của OpenAI, mà còn là biểu tượng cho làn sóng “AI có thể hành động” – điều sẽ định hình lại cách con người làm việc trong tương lai. Nếu thành công, đây có thể là bước đầu tiên đưa AI vượt khỏi màn hình chat và trở thành trợ lý ảo thực sự cho mọi người dùng máy tính.

4.5/5 - (151 votes)
BÀI VIẾT LIÊN QUAN
spot_img

BÀI VIẾT PHỔ BIẾN