Teknologi

Meta llama: semua yang perlu Anda ketahui tentang model AI generatif terbuka

Seperti setiap perusahaan teknologi besar akhir -akhir ini, Meta memiliki model AI generatif andalannya sendiri, yang disebut Llama. Llama agak unik di antara model -model utama karena “terbuka,” yang berarti pengembang dapat mengunduh dan menggunakannya sesuka mereka (dengan batasan tertentu). Itu berbeda dengan model seperti Claude Anthropic, Google Gemini, Xai's Grok, dan sebagian besar model chatgpt Openai, yang hanya dapat diakses melalui API.

Namun, untuk Minat Pilihan Pengembang, Meta juga telah bermitra dengan vendor, termasuk AWS, Google Cloud, dan Microsoft Azure, untuk membuat versi Llama yang diselenggarakan oleh cloud tersedia. Selain itu, perusahaan menerbitkan alat, perpustakaan, dan resep dalam buku masak Llama untuk membantu pengembang menyempurnakan, mengevaluasi, dan mengadaptasi model dengan domain mereka. Dengan generasi yang lebih baru seperti Llama 3 dan Llama 4, kemampuan ini telah diperluas untuk memasukkan dukungan multimodal asli dan peluncuran cloud yang lebih luas.

Inilah semua yang perlu Anda ketahui tentang Meta's Llama, dari kemampuan dan edisi ke tempat Anda dapat menggunakannya. Kami akan terus memperbarui posting ini saat meta merilis peningkatan dan memperkenalkan alat dev baru untuk mendukung penggunaan model.

Apa itu llama?

Llama adalah keluarga model – bukan hanya satu. Versi terbaru adalah Llama 4; Dirilis pada bulan April 2025 dan termasuk tiga model:

  • Pramuka: 17 miliar parameter aktif, 109 miliar total parameter, dan jendela konteks 10 juta token.
  • Maverick: 17 miliar parameter aktif, 400 miliar total parameter, dan jendela konteks 1 juta token.
  • Raksasa binatang: Belum dirilis tetapi akan memiliki 288 miliar parameter aktif dan 2 triliun total parameter.

(Dalam ilmu data, token adalah bit data mentah yang terbagi, seperti suku kata “Fan,” “Tas” dan “Tic” dalam kata “Fantastic.”)

Konteks model, atau jendela konteks, mengacu pada data input (misalnya, teks) yang dipertimbangkan model sebelum menghasilkan output (misalnya, teks tambahan). Konteks yang panjang dapat mencegah model dari “melupakan” konten dokumen dan data terbaru, dan dari membelokkan topik dan mengekstrapolasi secara salah. Namun, jendela konteks yang lebih lama juga bisa menghasilkan model “melupakan” pagar pengaman tertentu dan lebih rentan menghasilkan konten yang sejalan dengan percakapan, yang telah mengarahkan beberapa pengguna ke arah pemikiran delusi.

Sebagai referensi, jendela konteks 10 juta yang dijanjikan Llama 4 Scout secara kasar sama dengan teks sekitar 80 novel rata -rata. Hubungi 4 maverick 'S 1 juta jendela konteks sama dengan sekitar delapan novel.

Acara TechCrunch

San Francisco
|
27-29 Oktober 2025

Semua model Llama 4 dilatih pada “sejumlah besar teks, gambar, dan data video yang tidak berlabel” untuk memberi mereka “pemahaman visual yang luas,” serta pada 200 bahasa, menurut meta.

Llama 4 Scout dan Maverick adalah model multimodal bobot pertama meta. Mereka dibangun menggunakan arsitektur “campuran-ekspert” (MOE), yang mengurangi beban komputasi dan meningkatkan efisiensi dalam pelatihan dan inferensi. Scout, misalnya, memiliki 16 ahli, dan Maverick memiliki 128 ahli.

Llama 4 Behemoth mencakup 16 ahli, dan Meta menyebutnya sebagai guru untuk model yang lebih kecil.

Llama 4 dibangun di seri Llama 3, yang termasuk model 3.1 dan 3.2 yang banyak digunakan untuk aplikasi yang disesuaikan dengan instruksi dan penyebaran cloud.

Apa yang bisa dilakukan llama?

Seperti model AI generatif lainnya, Llama dapat melakukan berbagai tugas bantu yang berbeda, seperti mengkode dan menjawab pertanyaan matematika dasar, serta merangkum dokumen dalam setidaknya 12 bahasa (bahasa Arab, Inggris, Jerman, Prancis, Hindi, Indonesia, Italia, Portugis, Hindi, Spanyol, Tagalog, Thai, dan Vietnamese). Sebagian besar beban kerja berbasis teks-pikirkan menganalisis file besar seperti PDF dan spreadsheet-berada dalam bidangnya, dan semua model LLAMA 4 mendukung teks, gambar, dan input video.

Llama 4 Scout dirancang untuk alur kerja yang lebih lama dan analisis data besar -besaran. Maverick adalah model generalis yang lebih baik dalam menyeimbangkan kekuatan penalaran dan kecepatan respons, dan cocok untuk pengkodean, chatbots, dan asisten teknis. Dan Behemoth dirancang untuk penelitian lanjutan, model distilasi, dan tugas STEM.

Model LLAMA, termasuk LLAMA 3.1, dapat dikonfigurasi untuk memanfaatkan aplikasi pihak ketiga, alat, dan API untuk melakukan tugas. Mereka dilatih untuk menggunakan pencarian berani untuk menjawab pertanyaan tentang peristiwa terbaru; API Wolfram Alpha untuk kueri terkait matematika dan sains; dan juru bahasa Python untuk memvalidasi kode. Namun, alat -alat ini memerlukan konfigurasi yang tepat dan tidak diaktifkan secara otomatis di luar kotak.

Dimana saya bisa menggunakan llama?

Jika Anda hanya ingin mengobrol dengan llama, itu Powering the Meta Ai Chatbot Experience Di Facebook Messenger, WhatsApp, Instagram, Oculus, dan Meta.ai di 40 negara. Versi Llama yang disesuaikan digunakan dalam pengalaman meta AI di lebih dari 200 negara dan wilayah.

Llama 4 Model Scout dan Maverick tersedia di Llama.com dan mitra Meta, termasuk platform pengembang AI memeluk wajah. Behemoth masih dalam pelatihan. Pengembang yang membangun dengan Llama dapat mengunduh, menggunakan, atau menyempurnakan model di sebagian besar platform cloud yang populer. Meta mengklaim memiliki lebih dari 25 mitra yang menjadi tuan rumah Llama, termasuk NVIDIA, Databricks, Groq, Dell, dan Snowflake. Dan saat “menjual akses” ke model Meta yang tersedia secara terbuka bukanlah model bisnis Meta, perusahaan menghasilkan uang perjanjian pembagian pendapatan dengan model host.

Beberapa mitra ini telah membangun alat dan layanan tambahan di atas Llama, termasuk alat yang memungkinkan model referensi data hak milik dan memungkinkannya berjalan pada latensi yang lebih rendah.

Yang penting, lisensi llama membatasi bagaimana pengembang dapat menggunakan model: Pengembang aplikasi dengan lebih dari 700 juta pengguna bulanan harus meminta lisensi khusus dari meta yang akan diberikan perusahaan atas kebijaksanaannya.

Pada Mei 2025, Meta meluncurkan a program baru untuk memberi insentif kepada startup untuk mengadopsi model LLAMA -nya. Llama for Startups memberikan dukungan kepada perusahaan dari tim Llama Meta dan akses ke pendanaan potensial.

Bersama Llama, Meta menyediakan alat yang dimaksudkan untuk membuat model “lebih aman” untuk digunakan:

  • Panggil penjagakerangka kerja moderasi.
  • CybersecevalSuite penilaian risiko cybersecurity.
  • Llama Firewallpagar keamanan yang dirancang untuk memungkinkan membangun sistem AI yang aman.
  • Perisai Kodeyang memberikan dukungan untuk penyaringan inferensi-waktu dari kode tidak aman yang dihasilkan oleh LLMS.

Penjaga Llama mencoba untuk mendeteksi konten yang berpotensi bermasalah baik dimasukkan ke dalam-atau dihasilkan-oleh model Llama, termasuk konten yang berkaitan dengan aktivitas kriminal, eksploitasi anak, pelanggaran hak cipta, kebencian, melukai diri sendiri dan pelecehan seksual. Yang mengatakan, ini jelas bukan peluru perak sejak itu Pedoman meta sebelumnya memungkinkan chatbot untuk terlibat dalam obrolan sensual dan romantis dengan anak di bawah umur, dan beberapa laporan menunjukkan itu berubah menjadi percakapan seksual. Pengembang bisa menyesuaikan Kategori konten yang diblokir dan menerapkan blok untuk semua bahasa yang didukung Llama.

Seperti Llama Guard, Prompt Guard dapat memblokir teks yang ditujukan untuk Llama, tetapi hanya teks yang dimaksudkan untuk “menyerang” model dan membuatnya berperilaku dengan cara yang tidak diinginkan. Meta mengklaim bahwa Penjaga Llama dapat bertahan dari dorongan jahat yang secara eksplisit (yaitu, jailbreak yang berupaya untuk berkeliling filter keselamatan bawaan Llama) di samping petunjuk yang berisi “input yang disuntikkan. ” Llama Firewall bekerja untuk mendeteksi dan mencegah risiko seperti injeksi cepat, kode tidak aman, dan interaksi alat yang berisiko.

Sedangkan untuk Cyberseceval, ini lebih sedikit alat daripada kumpulan tolok ukur untuk mengukur keamanan model. Cyberseceval dapat menilai risiko yang ditimbulkan oleh model LLAMA (setidaknya menurut kriteria Meta) untuk pengembang aplikasi dan pengguna akhir di bidang -bidang seperti “rekayasa sosial otomatis” dan “penskalaan operasi cyber ofensif.”

Keterbatasan Llama

Kredit gambar:Analisis buatan

Llama hadir dengan risiko dan keterbatasan tertentu, seperti semua model AI generatif. Misalnya, sementara model terbarunya memiliki fitur multimodal, itu terutama terbatas pada bahasa Inggris untuk saat ini.

Zooming out, Meta menggunakan set data e-book bajakan dan artikel untuk melatih model llama -nya. Seorang hakim federal baru -baru ini memihak meta dalam gugatan hak cipta yang diajukan terhadap perusahaan oleh 13 penulis buku, yang memutuskan bahwa penggunaan karya hak cipta untuk pelatihan jatuh di bawah “penggunaan yang adil.” Namun, jika llama memuntahkan Cuplikan berhak cipta dan seseorang menggunakannya dalam suatu produk, mereka berpotensi melanggar hak cipta dan bertanggung jawab.

Meta juga secara kontroversial melatih AI -nya di Instagram dan posting Facebook, foto dan keterangan, dan menyulitkan pengguna untuk memilih keluar.

Pemrograman adalah area lain di mana bijaksana untuk melangkah ringan saat menggunakan llama. Itu karena Llama mungkin – mungkin lebih dari rekan -rekan AI generatifnya – menghasilkan kode buggy atau tidak aman. Pada LiveCodebenchA Benchmark Itu menguji model AI tentang masalah pengkodean kompetitif, model Meta Llama 4 Maverick mencapai skor 40%. Itu dibandingkan dengan 85% untuk Openai's GPT-5 High dan 83% untuk Xai's Grok 4 Fast.

Seperti biasa, yang terbaik adalah memiliki peninjauan ahli manusia apa pun kode yang dihasilkan AI sebelum memasukkannya ke dalam layanan atau perangkat lunak.

Akhirnya, seperti halnya model AI lainnya, model Llama masih bersalah karena menghasilkan informasi yang terdengar masuk akal tetapi salah atau menyesatkan, apakah itu dalam pengkodean, panduan hukum, atau Percakapan emosional dengan persona AI.

Ini awalnya diterbitkan pada 8 September 2024 dan diperbarui secara berkala dengan informasi baru.

Source

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button