Openai's GPT-5 ada di sini

Openai telah meluncurkan GPT-5, model AI andalan baru yang akan memberi daya pada chatgpt generasi perusahaan berikutnya.
GPT-5, yang dirilis Kamis, adalah model AI “terpadu” pertama Openai dan menggabungkan kemampuan penalarannya o-series model dengan respons cepat Seri GPT. Model generasi berikutnya menandakan era baru untuk chatgpt-dan penciptanya, openai-menunjuk ke ambisi Openai yang lebih luas untuk mengembangkan sistem AI yaitu lebih seperti agen dari chatbots.
Ketika GPT-4 Diaktifkan AI Chatbots untuk menawarkan tanggapan pintar pada berbagai pertanyaan, GPT-5 memungkinkan chatgpt untuk menyelesaikan berbagai tugas atas nama pengguna-seperti menghasilkan aplikasi perangkat lunak, menavigasi kalender pengguna, atau membuat brief penelitian.
Dengan GPT-5, Openai juga berusaha membuat chatgpt lebih mudah digunakan. Alih-alih meminta pengguna untuk memilih pengaturan yang tepat, GPT-5 dilengkapi dengan router real-time yang memutuskan bagaimana menawarkan jawaban terbaik, apakah itu menanggapi pertanyaan pengguna dengan cepat atau mengambil waktu tambahan untuk “berpikir” melalui jawaban.
Selama briefing dengan wartawan, CEO OpenAI Sam Altman mengklaim GPT-5 adalah “model terbaik di dunia,” dan mengatakan itu mewakili “langkah signifikan” di sepanjang jalur perusahaan untuk mengembangkan AI yang dapat mengungguli manusia dalam pekerjaan paling berharga secara ekonomi-yaitu, Kecerdasan Umum Buatan (AGI).
“Memiliki sesuatu seperti GPT-5 akan sangat tidak terbayangkan pada waktu sebelumnya dalam sejarah,” kata Altman.
Mulai Kamis, GPT-5 akan tersedia untuk semua pengguna chatgpt gratis sebagai model default mereka. VP Openai dari ChatGPT, Nick Turley, mengatakan ini adalah bagian dari upaya perusahaan untuk memberi pengguna gratis akses ke model penalaran AI untuk pertama kalinya. (Sebelumnya, perusahaan tersebut mengarahkan model yang lebih maju di belakang paywall.)
“Ini hanyalah salah satu cara saya bersemangat untuk menjalani misi, memastikan bahwa hal ini benar-benar menguntungkan orang,” kata Turley pada keputusan itu, merujuk pada Openai yang sudah lama ada misi untuk mendistribusikan AI canggih kepada sebanyak mungkin orang.
Acara TechCrunch
San Francisco
|
27-29 Oktober 2025
Harapannya tinggi untuk GPT-5, salah satu peluncuran produk Openai yang paling dinanti sejak ChatGPT menempatkan perusahaan di peta pada tahun 2022. Sejak itu, ChatGPT telah tumbuh menjadi salah satu produk konsumen paling populer di dunia, menjangkau lebih dari 700 juta pengguna setiap minggu-hampir 10% dari populasi dunia, menurut perusahaan.
Banyak yang melihat GPT-5 sebagai pelayan untuk kemajuan AI secara luas, dan penerimaan model oleh Silicon Valley dapat memiliki implikasi mendalam untuk teknologi besar, Wall Street, dan pembuat kebijakan yang mengatur teknologi. Para pemangku kepentingan ini menonton untuk melihat apakah GPT-5 menawarkan lompatan yang signifikan dalam kemampuan AI, seperti pendahulunya, GPT-4, yang menantang ekspektasi apa yang dapat dilakukan perangkat lunak.
GPT-5 menawarkan sedikit keunggulan pada kompetisi
Openai mengklaim GPT-5 adalah canggih di beberapa domain, sedikit menyisihkan model AI terkemuka dari Anthropic, Google DeepMind, dan XAI Elon Musk pada tolok ukur utama. Namun, GPT-5 sedikit berkinerja buruk model AI perbatasan di daerah lain.
Perusahaan mengatakan GPT-5 menawarkan kinerja tingkat perbatasan di sekitar pengkodean; Altman mengatakan model itu secara khusus unggul dalam memutar seluruh aplikasi perangkat lunak sesuai permintaan, dalam apa yang dikenal sebagai “pengkodean getaran.”
Pada swe-bench diverifikasi-tes tugas pengkodean dunia nyata yang ditarik dari skor GitHub-GPT-5 74,9% pada upaya pertamanya. Itu berarti GPT-5 hanya mengungguli model Claude Opus 4.1 terbaru Anthropic, yang mencetak gol 74,5%dan Google Deepmind's Gemini 2.5 Pro, yang mencetak gol 59,6%.
Pada ujian terakhir kemanusiaan-tes sulit yang mengukur kinerja model AI di seluruh matematika, humaniora, dan ilmu alam-versi GPT-5 dengan penalaran yang diperluas (GPT-5 Pro) mencetak 42% saat menggunakan alat. Itu sedikit kurang dari yang bisa dicapai oleh Xai Grok 4 beratyang mencetak 44,4% pada tes.

Pada GPQA Diamond-Tes pertanyaan sains tingkat PhD-GPT-5 Pro mencetak 89,4%pada percobaan pertamanya, mengungguli Claude Opus 4.1, yang mencetak 80,9%, dan Grok 4 Heavy, yang mencetak 88,9%.
Openai mengatakan GPT-5 lebih baik untuk menjawab pertanyaan terkait kesehatan. Pada akurasi pengukuran tes dalam respons model AI di sekitar topik perawatan kesehatan, halusinasi Healthbench Hard, Openai mengatakan GPT-5 (dengan pemikiran) berhalusinasi hanya 1,6% dari waktu. Ini jauh lebih rendah dari model GPT-4O dan O3 perusahaan sebelumnya, yang masing-masing mencetak 12,9% dan 15,8.
Sementara AI Chatbots bukan profesional medis, jutaan orang menggunakannya untuk nasihat kesehatan. Menanggapi fenomena ini, perusahaan mengatakan GPT-5 lebih proaktif tentang penandaan potensi masalah kesehatan, dan membantu pengguna mengurai hasil medis.
Selain itu, Openai mengatakan GPT-5 lebih baik daripada model AI lainnya pada lebih sulit untuk diukur, domain subyektif, seperti desain dan penulisan kreatif. Turley mengatakan GPT-5 merespons lebih alami dan menunjukkan “selera yang lebih baik” daripada model AI lainnya pada tugas kreatif.
“Getaran model ini sangat bagus,” kata Turley.
GPT-5 juga lebih akurat daripada model OpenAI sebelumnya, dan perusahaan mengatakan mereka menderita jauh lebih sedikit dari halusinasi-kecenderungan model AI untuk membuat informasi-dibandingkan dengan model O-Seriesnya. Halusinasi tampaknya semakin buruk Dalam model penalaran AI terbaru Openai, seperti O3, dan Openai sebelumnya mengatakan tidak begitu mengerti mengapa itu terjadi.
Sebagai tanggapan terhadap chatgpt prompts, Openai menemukan bahwa GPT-5 (dengan pemikiran) berhalusinasi dan merespons dengan informasi yang salah 4,8% dari waktu. Itu adalah pengurangan yang signifikan dari O3 dan GPT-4O, yang mencetak tingkat halusinasi 22% dan 20,6% pada tes.
Pada tolok ukur yang mengukur kemampuan agen model AI untuk menyelesaikan tugas online yang disimulasikan, Tau-Bench, GPT-5 menawarkan kinerja campuran. Pada bagian tes mengukur kemampuan AI untuk menavigasi situs web maskapai, GPT-5 mencetak 63,5% sedikit berkinerja buruk O3, yang mencetak 64,8%. Pada bagian lain dari pengujian pengukuran kemampuan AI untuk menavigasi situs web ritel, skor GPT-5 81,1%, Claude Opus 4.1 yang berkinerja buruk, yang mendapat nilai 82,4%.
Openai juga mengatakan bahwa GPT-5 lebih aman dari model sebelumnya. Sementara model penalaran AI sesekali menunjukkan kecenderungan Skema melawan manusia Atau berbohong untuk mempromosikan tujuan mereka sendiri, Openai menemukan bahwa GPT-5 menipu pada tingkat yang lebih rendah daripada model lain.
Openai Safety Research Leutel Alex Beutel mengatakan mengurangi penipuan tidak hanya meningkatkan keamanan GPT-5, tetapi juga pengalaman pengguna, menciptakan model yang lebih “transparan dan jujur dalam cara yang dapat dipercaya oleh pengguna.”
Beutel juga mencatat GPT-5 lebih baik dalam membedakan antara aktor buruk yang mencoba menyalahgunakan chatgpt dan pengguna yang membuat permintaan yang tidak berbahaya. Hal ini menghasilkan GPT-5 dapat menolak lebih banyak pertanyaan yang tidak aman, sambil menawarkan lebih sedikit penolakan kepada pengguna yang mencari informasi yang tidak berbahaya.
Peningkatan untuk konsumen dan pengembang
ChatGPT mendapatkan beberapa peningkatan pengalaman pengguna sebagai bagian dari peluncuran GPT-5. Pengguna sekarang dapat memilih dari empat kepribadian baru dalam pengaturan ChatGPT: Cynic, Robot, Listener, dan Nerd. Perusahaan mengatakan ini akan mengadaptasi tanggapan ChatGPT tanpa mengharuskan pengguna untuk secara spesifik meminta model untuk merespons dengan cara tertentu.
Pelanggan Rencana Plus Plus ChatGPT $ 20 per bulan mendapatkan batas penggunaan yang lebih tinggi untuk GPT-5 daripada pengguna gratis. Sementara itu, pelanggan Pro $ 200 per bulan akan memiliki akses tanpa batas ke GPT-5, serta versi sup yang disebut GPT-5 Pro yang menggunakan sumber daya komputasi tambahan untuk menghasilkan jawaban yang lebih baik. Organisasi di tim Openai, EDU, dan rencana perusahaan akan mendapatkan akses ke GPT-5 sebagai model default mereka minggu depan.
Untuk pengembang, GPT-5 akan datang ke API Openai dalam tiga ukuran-GPT-5, GPT-5-Mini, dan GPT-5-Nano-yang akan menghabiskan lebih atau lebih sedikit waktu “penalaran” melalui tugas. Pengembang juga sekarang dapat mengontrol verbositas dalam API Openai, memutuskan berapa lama atau pendek respons model AI.
Model dasar GPT-5 akan menelan biaya pengembang $ 1,25 per juta token input (sekitar 750.000 kata, lebih lama dari seluruh seri Lord of the Rings), dan $ 10 per juta token output.
Peluncuran GPT-5 datang setelah seminggu yang sibuk untuk Openai. Perusahaan merilis model penalaran bobot terbuka, GPT-OSSbahwa pengembang dan perusahaan dapat mengunduh secara gratis dan dijalankan dengan harga yang sebagian kecil. Model terbuka hampir cocok dengan kemampuan model top Openai sebelumnya, O3 dan O4-Mini, tetapi GPT-5 menetapkan standar baru untuk kinerja Frontier di beberapa area, seperti pengkodean.
Namun, GPT-5 tampaknya kira-kira setara dengan model AI perbatasan lainnya di beberapa area. Tolok ukur, tentu saja, hanya menceritakan sebagian dari cerita untuk model AI apa pun, dan masih harus dilihat bagaimana pengembang akan menggunakan GPT-5 di dunia nyata, dan apakah model itu benar-benar langkah di atas kompetisi.