Agen ChatGPT Openai dapat mengontrol PC Anda untuk melakukan tugas atas nama Anda – tetapi bagaimana cara kerjanya dan apa gunanya?

OpenAI telah meluncurkan ChatGPT Agent, peningkatan model intelijen buatan (AI) andalannya yang melengkapi dengan komputer virtual dan toolkit terintegrasi.
Alat-alat baru ini memungkinkan agen untuk melakukan tugas-tugas multi-langkah yang kompleks yang tidak mampu dilakukan oleh iterasi chatgpt sebelumnya-mengendalikan komputer Anda dan menyelesaikan tugas untuk Anda.
Versi yang lebih kuat ini, yang masih sangat bergantung pada input dan pengawasan manusia, tiba sesaat sebelum Mark Zuckerberg mengumumkan bahwa meta peneliti telah mengamati model AI mereka sendiri yang menunjukkan Tanda-tanda peningkatan diri yang independen. Ini juga diluncurkan sesaat sebelum OpenAI meluncurkan GPT-5-versi terbaru Openai's Chatbot.
Dengan agen chatgpt, pengguna sekarang dapat meminta Model Bahasa Besar (LLM) untuk tidak hanya melakukan analisis atau mengumpulkan data, tetapi untuk bertindak berdasarkan data itu, kata perwakilan Openai dalam a penyataan.
Misalnya, Anda dapat memerintahkan agen untuk menilai kalender Anda dan memberi pengarahan kepada Anda pada acara dan pengingat mendatang, atau untuk mempelajari kumpulan data dan merangkumnya dalam sinopsis bernas atau sebagai dek geser. Sementara LLM tradisional dapat mencari dan menyediakan resep untuk sarapan bergaya Jepang, agen chatgpt dapat sepenuhnya merencanakan dan membeli bahan untuk sarapan yang sama untuk jumlah tamu tertentu.
Namun model baru, meskipun sangat mampu, masih menghadapi sejumlah keterbatasan. Seperti semua model AI, penalaran spasialnya lemah, sehingga berjuang dengan tugas -tugas seperti merencanakan rute fisik. Ini juga tidak memiliki memori persisten yang benar, memproses informasi pada saat ini tanpa penarikan yang dapat diandalkan atau kemampuan untuk merujuk interaksi sebelumnya di luar konteks langsung.
Namun, agen chatgpt menunjukkan peningkatan yang signifikan dalam pembandingan Openai. Pada Ujian terakhir umat manusiatolok ukur AI yang mengevaluasi kemampuan model untuk menanggapi pertanyaan tingkat ahli di sejumlah disiplin ilmu, itu lebih dari dua kali lipat persentase akurasi (41,6%) versus OpenAI O3 tanpa alat yang dilengkapi (20,3%).
Terkait: Model AI 'terpintar' Openai secara eksplisit disuruh untuk ditutup – dan ditolak
Ini juga berkinerja jauh lebih baik daripada alat Openai lainnya, serta versi dirinya yang tidak memiliki alat seperti browser dan komputer virtual. Dalam tolok ukur matematika yang paling dikenal di dunia, Frontiermath, agen chatgpt dan pelengkap alatnya lagi mengungguli model sebelumnya dengan selisih yang luas.
Agen ini dibangun di atas tiga pilar yang berasal dari produk openai sebelumnya. Satu kaki adalah 'Operator', agen yang akan menggunakan browser virtualnya sendiri untuk menyelami web untuk pengguna. Yang kedua adalah 'Deep Research', dibangun untuk menyisir dan mensintesis sejumlah besar data. Bagian terakhir dari teka -teki ini adalah versi chatgpt sebelumnya, yang unggul dalam kelancaran dan presentasi percakapan.
“Intinya, ia dapat menelusuri web secara mandiri, menghasilkan kode, membuat file, dan sebagainya, semuanya di bawah pengawasan manusia,” kata Kofi Nyarkoseorang profesor di Morgan State University dan Direktur Laboratorium Penelitian Rekayasa Data dan Prediktif Analytics (DEPA).
Nyarko dengan cepat menekankan, bagaimanapun, bahwa agen baru masih belum otonom. “Halusinasi, kerapuhan antarmuka pengguna, atau kesalahan interpretasi dapat menyebabkan kesalahan. Perlindungan bawaan, seperti permintaan izin dan interupsi, sangat penting tetapi tidak cukup untuk menghilangkan risiko sepenuhnya.”
Bahaya memajukan AI
Openai memiliki dirinya sendiri mengakui bahayanya agen baru dan peningkatan otonominya. Perwakilan perusahaan menyatakan bahwa agen chatgpt memiliki “kemampuan biologis dan kimia yang tinggi,” yang mereka klaim berpotensi memungkinkannya untuk membantu dalam penciptaan senjata kimia atau biologis.
Dibandingkan dengan sumber daya yang ada, seperti laboratorium kimia dan buku teks, agen AI mewakili apa yang oleh para ahli biosekuriti disebut sebagai “jalur peningkatan kemampuan.” AI dapat menggunakan sumber daya yang tak terhitung jumlahnya dan mensintesis data di dalamnya secara instan, menggabungkan pengetahuan di seluruh disiplin ilmu, memberikan pemecahan masalah berulang seperti mentor ahli, menavigasi situs web pemasok, mengisi formulir pesanan, dan bahkan membantu memotong pemeriksaan verifikasi dasar.
Dengan komputer virtualnya, agen juga dapat berinteraksi secara mandiri dengan file, situs web, dan alat online dengan cara yang memberdayakannya untuk melakukan lebih banyak potensi bahaya jika disalahgunakan. Peluang untuk pelanggaran data atau manipulasi data, serta untuk perilaku yang tidak selaras seperti penipuan finansial, diperkuat dalam hal a serangan injeksi yang cepat atau membajak.
Seperti yang ditunjukkan Nyarko, risiko -risiko ini merupakan tambahan bagi yang tersirat dalam model AI tradisional dan LLM.
“Ada kekhawatiran yang lebih luas untuk agen AI secara keseluruhan, seperti bagaimana agen yang beroperasi secara mandiri dapat memperkuat kesalahan, memperkenalkan bias dari data publik, kerangka kerja pertanggungjawaban yang rumit, dan secara tidak sengaja menumbuhkan ketergantungan psikologis,” katanya.
Menanggapi ancaman baru yang ditimbulkan oleh model yang lebih agensi, insinyur openai juga telah memperkuat sejumlah perlindungan, kata perwakilan perusahaan dalam pernyataannya.
Ini termasuk pemodelan ancaman, pelatihan penolakan ganda-di mana model diajarkan untuk menolak permintaan berbahaya di sekitar data yang dapat memiliki manfaat yang menguntungkan atau berbahaya-program karunia bug, dan ahli tim merah-menganalisis kelemahan dengan menyerang sistem sendiri-berfokus pada biodefense. Namun, a Penilaian Manajemen Risiko Dilakukan pada bulan Juli 2025 oleh Saferai, nirlaba yang berfokus pada keselamatan, yang disebut kebijakan manajemen risiko Openai lemah, memberi mereka skor 33% dari kemungkinan 100%. Openai juga hanya mencetak nilai C di Indeks Keselamatan AI Disusun oleh Future of Life Institute, sebuah perusahaan keselamatan AI terkemuka.