Ngày 17/7, OpenAI công bố ChatGPT Agent – một phần mở rộng của nền tảng ChatGPT, được thiết kế để thực hiện các tác vụ đa bước mà trước đây yêu cầu sự can thiệp trực tiếp của con người.
Công cụ này cho phép người dùng mô tả một mục tiêu bằng ngôn ngữ tự nhiên và để hệ thống xử lý toàn bộ quy trình từ tìm kiếm thông tin đến thao tác dữ liệu và xuất kết quả.
Khác với các phiên bản ChatGPT trước đây vốn chủ yếu phục vụ trao đổi văn bản hoặc tạo nội dung, ChatGPT Agent có khả năng tương tác với các thành phần như trình duyệt web, bảng tính, hệ thống tệp và dòng lệnh.
Ví dụ, người dùng có thể yêu cầu hệ thống tìm kiếm thông tin từ một trang web, tải tệp liên quan, phân tích dữ liệu trong file Excel và tạo một bản trình bày dựa trên kết quả phân tích đó.
ChatGPT Agent có thể điều khiển máy tính và làm việc thay cho con người. Ảnh: The Verge Trong bản demo, OpenAI trình diễn các tiềm năng của ChatGPT Agent, như yêu cầu nó lên kế hoạch hẹn hò buổi tối bằng cách kết nối với Google Calendar để xem khi nào người dùng rảnh rỗi, rồi đối chiếu với ứng dụng OpenTable để tìm kiếm một số nhà hàng.
Người dùng có thể can thiệp vào quá trình này khi yêu cầu tìm kiếm một loại nhà hàng khác. Trong một ví dụ khác, OpenAI Agent được đề nghị viết báo cáo chung về cạnh tranh giữa hai loại búp bê Labubus và Beanie Babies.