Berita

Abu Dhabi meluncurkan model penalaran AI berbiaya rendah dalam tantangan untuk openai, deepseek

Omer Taha Cetin | Anadolu | Gambar getty

Penantang baru dalam perlombaan intelijen buatan global telah memasuki ring.

Mohamed Bin Zayed University of Artificial Intelligence (MBZUAI), sebuah universitas riset yang berfokus pada AI yang didirikan oleh Uni Emirat Arab, mengumumkan pada hari Selasa tentang rilis model penalaran baru yang berbiaya rendah untuk menyaingi Openai dan Deepseek.

Itu datang setelah Deepseek, laboratorium AI Cina, awal tahun ini mengejutkan dunia Dengan rilis model penalaran yang disebut R1 yang katanya bisa mengungguli Openai tetapi dengan biaya pelatihan yang jauh lebih sedikit.

Pada hanya 32 miliar parameter, model Mbzuai, yang dijuluki K2 Think, jauh lebih kecil daripada sistem yang bersaing dari Openai dan Deepseek. Itu dibangun di atas Alibaba’s Model Qwen 2.5 open-source dan dijalankan dan diuji pada perangkat keras yang disediakan oleh AI Chipmaker Cerebas.

Untuk konteks, Deepseek's R1 memiliki total 671 miliar parameter, yang pada dasarnya adalah istilah lain untuk variabel yang dipelajari oleh model bahasa AI untuk memahami dan menghasilkan bahasa. Openai tidak mengungkapkan jumlah parameter model AI -nya.

K2 Think dikembangkan dalam kemitraan dengan G42, Firma AI berbasis UEA Buzzy didukung oleh raksasa teknologi AS Microsoft. Para peneliti di belakangnya mengatakan itu memberikan kinerja yang setara dengan model penalaran andalan openai dan Deepseek – meskipun merupakan sebagian kecil dari ukurannya.

Mereka mengutip tolok ukur AIME24, AIME25, HMMT25 dan Omni-Math-Hard, yang berhubungan dengan matematika, pengkodean patokan LiveCodebenchv5 dan Benchmark Sains GPQA-Diamond.

Bagaimana mereka melakukannya?

Hector Liu, direktur Institut Model Yayasan MBZUai, mengatakan kepada CNBC bahwa tim di belakang K2 Think mampu mencapai tingkat kinerja yang tinggi dengan menggunakan sejumlah metode.

Mereka termasuk fine-tuning yang diawasi rantai panjang (COT)-metode penalaran langkah demi langkah-serta apa yang disebut penskalaan waktu tes, yang merupakan teknik untuk meningkatkan kinerja dengan mengalokasikan sumber daya komputasi ekstra selama “menyimpulkan”-atau, menerapkan pengetahuan yang dipelajari pada data yang belum pernah dilihat sebelumnya.

“Apa yang istimewa dari model kami adalah kami memperlakukannya lebih seperti sistem daripada hanya model,” kata Liu kepada CNBC. “Jadi, tidak seperti model sumber terbuka reguler di mana kita bisa melepaskan model, kita sebenarnya menggunakan model dan melihat bagaimana kita dapat meningkatkan model dari waktu ke waktu.”

“Jika Anda bertanya kepada saya salah satu langkah tunggal yang paling penting, sangat sulit untuk dikatakan. Ini lebih seperti metode sistem yang berfungsi di mana semua metode ini digabungkan memberikan hasil akhir,” tambahnya.

Mengapa itu penting?

Di luar itu, ada juga kompleksitas geopolitik yang menyelimuti ambisi AI UEA. Investasi dan kemitraan Microsoft dengan G42 tahun lalu menarik a banyak pengawasan di AS terkait dengan hubungan perusahaan dengan China.

Secara lebih luas, industri AI UEA masih memiliki jalan panjang untuk mencapai skala rekan -rekan AS dan Cina. Openai dan para pemain teknologi besar telah menikmati awal yang baik dengan model AI yayasan masing -masing, sementara Beijing telah lama menganggap AI sebagai prioritas strategis.

Fokus pada terobosan ilmiah

Sementara K2 Think menunjukkan kinerja yang setara dengan Openai, pengembang sistem mengatakan tujuannya bukan untuk membangun chatbot seperti chatgpt. Richard Morton, direktur pelaksana untuk Institut Model Yayasan MBZUai, menjelaskan bahwa model ini dimaksudkan untuk melayani penggunaan spesifik di bidang -bidang seperti matematika dan sains.

“Faktanya adalah bahwa alasan mendasar dari otak manusia adalah landasan dari semua proses berpikir,” kata Morton kepada CNBC.

“Dengan aplikasi khusus ini, alih -alih mengambil 1.000, 2.000 manusia lima tahun untuk memikirkan pertanyaan tertentu, atau melalui serangkaian uji klinis tertentu atau sesuatu seperti itu, ini sangat memadatkan periode itu.”

Ini juga dapat memperluas jangkauan teknologi AI canggih di daerah yang tidak memiliki akses ke jenis modal dan infrastruktur yang dimiliki perusahaan AS.

“Apa yang kami temukan adalah Anda dapat melakukan lebih banyak dengan lebih sedikit,” kata Morton.

Source

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button