Claude Sonnet 4.5 là phiên bản AI mới nhất do Anthropic phát triển, ra mắt chỉ sau bốn tháng kể từ bản Claude Sonnet 4. Với những cải tiến đáng kể về khả năng lập trình, thực thi tác vụ và chống lại tấn công bảo mật, mô hình này đang được đánh giá là một trong những bước tiến quan trọng của Anthropic trong hành trình cạnh tranh với các ông lớn như OpenAI và Google.
Mục lục
Khả năng lập trình và công cụ đi kèm của Claude Sonnet 4.5
Claude Sonnet 4.5 không chỉ dừng ở việc cải thiện sức mạnh mô hình mà còn đi kèm một loạt cập nhật hệ sinh thái công cụ hỗ trợ lập trình viên. Claude Code giờ đây được bổ sung tính năng “checkpoints”, cho phép lưu và khôi phục lại các phiên làm việc. Bên cạnh đó, giao diện dòng lệnh được thiết kế lại trực quan hơn và một extension dành riêng cho VS Code cũng được ra mắt. Trên nền tảng API, các tính năng mới như chỉnh sửa ngữ cảnh và quản lý bộ nhớ giúp AI agent xử lý các quy trình phức tạp hơn trong thời gian dài. Đáng chú ý, người dùng ứng dụng Claude giờ đây có thể trực tiếp thực thi mã lệnh và tạo tệp trong giao diện trò chuyện, mở ra nhiều tiện ích mới.

Ra mắt Claude Agent SDK
Một điểm đột phá khác của lần cập nhật này chính là việc Anthropic phát hành bộ Claude Agent SDK. Đây là bộ công cụ mà trước đây công ty chỉ sử dụng nội bộ để xây dựng Claude Code. Với việc công khai SDK, các nhà phát triển có thể tự tạo ra những AI agent tùy biến, mở rộng ứng dụng AI vào nhiều lĩnh vực khác nhau. Điều này cho thấy định hướng của Anthropic là không chỉ cung cấp mô hình AI mà còn tạo hệ sinh thái để cộng đồng tham gia xây dựng.
Hiệu suất vượt trội trên benchmark
Theo công bố của Anthropic, Claude Sonnet 4.5 đạt 61.4% trên bài test OSWorld, vượt xa mức 42.2% của Sonnet 4. Đây là chỉ số đo lường khả năng thực thi tác vụ trên máy tính, cho thấy sự cải thiện rõ rệt trong việc xử lý các nhiệm vụ phức tạp. Ngoài ra, trên bộ kiểm tra SWE-bench – tiêu chuẩn để đánh giá năng lực viết và sửa lỗi phần mềm – mô hình cũng đạt kết quả cao. Không chỉ vậy, Sonnet 4.5 còn được cải thiện kiến thức trong các lĩnh vực chuyên ngành như tài chính, y khoa, luật và STEM, mở rộng khả năng ứng dụng trong thực tiễn.

Cải thiện bảo mật và tính cân bằng
Anthropic nhấn mạnh rằng Claude Sonnet 4.5 được huấn luyện để tăng cường “sự cân bằng”. Đây là khái niệm nhằm hạn chế hành vi AI đưa ra thông tin sai lệch hoặc trả lời theo cách nịnh bợ. Đồng thời, khả năng chống lại tấn công “prompt injection” – phương thức lợi dụng câu lệnh để đánh lừa AI – cũng được nâng cấp. Nhờ đó, các hệ thống sử dụng Sonnet 4.5 có thể tự thực thi tác vụ một cách an toàn và đáng tin cậy hơn.

Tương lai và khả năng ứng dụng của Claude Sonnet 4.5
Hiện Claude Sonnet 4.5 đã được cung cấp qua API với mức giá không đổi so với phiên bản trước. Ngoài ra, Anthropic còn giới thiệu một tính năng thử nghiệm mang tên “Imagine with Claude”, cho phép người dùng gói Max trải nghiệm khả năng tạo phần mềm theo thời gian thực. Đây được xem là bước thử nghiệm cho định hướng đưa AI từ chỗ chỉ hỗ trợ tìm kiếm và hội thoại sang một công cụ lập trình và sáng tạo phần mềm trực tiếp.
Với Claude Sonnet 4.5, Anthropic đang chứng minh sự nghiêm túc trong việc định hình AI cho nhà phát triển. Sự kết hợp giữa mô hình mạnh mẽ, công cụ tiện ích và hệ sinh thái mở hứa hẹn đưa Anthropic trở thành một thế lực lớn hơn trong cuộc đua AI toàn cầu




