Teknologi

Openai meluncurkan dua model penalaran AI 'terbuka'

Openai mengumumkan Selasa peluncuran dua model penalaran AI terbuka dengan kemampuan serupa ke seri-o-nya. Keduanya tersedia secara bebas untuk diunduh dari platform pengembang online, Wajah memelukkata perusahaan itu, menggambarkan model sebagai “canggih” ketika diukur di beberapa tolok ukur untuk membandingkan model terbuka.

Model datang dalam dua ukuran: model GPT-OSS-120B yang lebih besar dan lebih cakap yang dapat berjalan pada GPU NVIDIA tunggal, dan model GPT-OSS-20B yang lebih ringan yang dapat berjalan pada laptop konsumen dengan memori 16GB.

Peluncuran menandai model bahasa 'terbuka' pertama Openai sejak itu GPT-2yang dirilis lebih dari lima tahun yang lalu.

Dalam sebuah briefing, Openai mengatakan model terbuka akan mampu mengirimkan permintaan yang kompleks Model AI di cloud, seperti yang dilaporkan TechCrunch sebelumnya. Itu berarti jika model terbuka Openai tidak mampu melakukan tugas tertentu, seperti memproses gambar, pengembang dapat menghubungkan model terbuka ke salah satu model tertutup perusahaan yang lebih mampu.

Sementara model AI open-source openai di masa-masa awalnya, perusahaan umumnya lebih menyukai pendekatan pengembangan sumber tertutup. Strategi yang terakhir telah membantu Openai membangun bisnis besar yang menjual akses ke model AI -nya melalui API ke perusahaan dan pengembang.

Namun, CEO Sam Altman mengatakan pada bulan Januari ia yakin Openai telah “berada di sisi sejarah yang salah” ketika datang untuk membuka sumber teknologinya. Perusahaan saat ini menghadapi tekanan yang meningkat dari laboratorium AI Cina – termasuk Deepseek, Qwen Alibaba, dan AI Moonshot – yang telah mengembangkan beberapa model terbuka yang paling mampu dan populer di dunia. (Sementara Meta sebelumnya mendominasi ruang AI terbuka, model Llama AI perusahaan memiliki Tertinggal dalam setahun terakhir.)

Pada bulan Juli, administrasi Trump juga mendesak pengembang AI AS Teknologi Open Source Lebih Banyak Untuk mempromosikan adopsi global AI yang selaras dengan nilai -nilai Amerika.

Acara TechCrunch

San Francisco
|
27-29 Oktober 2025

Dengan rilis GPT-OSS, Openai berharap dapat mengikat dengan pengembang dan administrasi Trump, yang keduanya telah menyaksikan laboratorium AI Cina naik menjadi terkenal di ruang open source.

“Kembali ke ketika kami mulai pada tahun 2015, misi Openai adalah untuk memastikan AGI yang menguntungkan seluruh kemanusiaan,” kata CEO Openai Sam Altman dalam sebuah pernyataan yang dibagikan dengan TechCrunch. “Untuk itu, kami sangat senang dunia untuk membangun tumpukan AI terbuka yang dibuat di Amerika Serikat, berdasarkan nilai -nilai demokratis, tersedia secara gratis untuk semua dan untuk manfaat yang luas.”

(Foto oleh Tomohiro Ohsumi/Getty Images)Kredit gambar:Tomohiro Ohsumi / Getty Images

Bagaimana model dilakukan

Openai bertujuan untuk membuatnya Buka Model A Pemimpin Di antara model AI terbuka lainnya, dan perusahaan mengklaim telah melakukan hal itu.

Pada codeforces (dengan alat), tes pengkodean kompetitif, GPT-OSS-120B dan GPT-OSS-20B skor 2622 dan 2516, masing-masing, mengungguli Deepseek's R1 sementara O3 dan O4-Mini yang berkinerja buruk.

Kinerja Model Terbuka Openai pada Codeforces (Kredit: OpenAi).

Pada ujian terakhir Kemanusiaan, tes yang menantang dari pertanyaan-pertanyaan yang bersumber dari kerumunan di berbagai subjek (dengan alat), skor GPT-OSS-120B dan GPT-OSS-20B masing-masing 19% dan 17,3%. Demikian pula, ini berkinerja buruk O3 tetapi mengungguli model terbuka terkemuka dari Deepseek dan Qwen.

Kinerja Model Terbuka Openai di HLE (Kredit: OpenAi).

Khususnya, model terbuka OpenAI berhalusinasi secara signifikan lebih dari model penalaran AI terbaru, O3 dan O4-Mini.

Halusinasi telah menjadi lebih parah Dalam model penalaran AI terbaru Openai, dan perusahaan sebelumnya mengatakan tidak begitu mengerti mengapa. Dalam kertas putih, Openai mengatakan ini “diharapkan, karena model yang lebih kecil memiliki pengetahuan dunia yang lebih sedikit daripada model perbatasan yang lebih besar dan cenderung lebih berhalusinasi.”

Openai menemukan bahwa GPT-OSS-120B dan GPT-OSS-20B berhalusinasi sebagai tanggapan terhadap 49% dan 53% pertanyaan tentang PersonQA, tolok ukur in-house perusahaan untuk mengukur keakuratan pengetahuan model tentang orang. Itu lebih dari tiga kali lipat tingkat halusinasi model O1 Openai, yang mencetak 16%, dan lebih tinggi dari model O4-Mini-nya, yang mencetak 36%.

Melatih model baru

Openai mengatakan model terbukanya dilatih dengan proses yang sama dengan model miliknya. Perusahaan mengatakan setiap model terbuka memanfaatkan campuran-of-experts (MOE) untuk mengetuk lebih sedikit parameter untuk setiap pertanyaan yang diberikan, membuatnya berjalan lebih efisien. Untuk GPT-OSS-120B, yang memiliki 117 miliar total parameter, OpenAI mengatakan model hanya mengaktifkan 5,1 miliar parameter per token.

Perusahaan juga mengatakan model terbukanya dilatih menggunakan komputasi tinggi Pembelajaran Penguatan (RL) -Proses pasca-pelatihan untuk mengajarkan model AI yang benar dari yang salah dalam lingkungan simulasi menggunakan kelompok besar GPU NVIDIA. Ini juga digunakan untuk melatih o-series model Openai, dan model terbuka memiliki proses rantai yang serupa di mana mereka mengambil waktu tambahan dan sumber daya komputasi untuk mengerjakan jawaban mereka.

Sebagai hasil dari proses pasca-pelatihan, OpenAI mengatakan model AI terbuka unggul dalam memberi daya agen AI, dan mampu memanggil alat seperti pencarian web atau eksekusi kode python sebagai bagian dari proses rantai-dipikirkan. Namun, Openai mengatakan model terbuka hanya teks, yang berarti mereka tidak akan dapat memproses atau menghasilkan gambar dan audio seperti model perusahaan lainnya.

OpenAI merilis GPT-OSS-120B dan GPT-OSS-20B di bawah lisensi Apache 2.0, yang umumnya dianggap sebagai salah satu yang paling permisif. Lisensi ini akan memungkinkan perusahaan untuk memonetisasi model terbuka Openai tanpa harus membayar atau mendapatkan izin dari perusahaan.

Namun, tidak seperti penawaran open source sepenuhnya dari AI Labs seperti AI2, Openai mengatakan itu tidak akan merilis data pelatihan yang digunakan untuk membuat model terbuka. Keputusan ini tidak mengherankan mengingat bahwa beberapa gugatan aktif terhadap penyedia model AI, termasuk Openai, menuduh bahwa perusahaan -perusahaan ini secara tidak tepat melatih model AI mereka secara tidak tepat pada karya -karya yang dilindungi hak cipta.

Openai terlambat rilis model terbukanya beberapa kali dalam beberapa bulan terakhir, sebagian untuk mengatasi masalah keamanan. Di luar kebijakan keselamatan khas perusahaan, Openai mengatakan dalam sebuah buku putih bahwa mereka juga menyelidiki apakah aktor jahat dapat menyempurnakan model GPT-OSS-nya agar lebih membantu dalam serangan cyber atau penciptaan senjata biologis atau kimianya.

Setelah pengujian dari OpenAI dan evaluator pihak ketiga, perusahaan mengatakan GPT-OSS dapat sedikit meningkatkan kemampuan biologis. Namun, ia tidak menemukan bukti bahwa model-model terbuka ini dapat mencapai ambang batas “kemampuan tinggi 'untuk bahaya di domain ini, bahkan setelah penyesuaian.

Sementara model OpenAI tampaknya merupakan model yang canggih di antara model-model terbuka, pengembang dengan penuh semangat menunggu rilis Deepseek R2, model penalaran AI berikutnya, serta model terbuka baru dari Lab Superintelligence baru Meta.

Source

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button