Llama 3.2: Model AI Multimodal Open Source Terbaru dari Meta
Meta, perusahaan induk Facebook, Instagram, dan WhatsApp, telah meluncurkan model bahasa besar (LLM) terbarunya, Llama 3.2, di acara Meta Connect. Model AI multimodal ini dirancang untuk bersaing dengan GPT-4o Mini milik OpenAI yang diluncurkan pada bulan Juli. Llama 3.2 merupakan model AI open source yang mampu memahami gambar dan teks, membuka peluang baru bagi berbagai aplikasi yang membutuhkan pemahaman visual.
Keunggulan Llama 3.2
Mark Zuckerberg, CEO Meta, menyatakan bahwa Llama 3.2 telah mengalami kemajuan signifikan sejak tahun 2023 dan diklaim setara dengan GPT-4o Mini dalam kemampuan mengenali gambar dan memahami visual. Ia juga menegaskan bahwa Llama 3.2 unggul dari model AI open-source lainnya seperti Gemma milik Google dan Phi 3.5-mini milik Microsoft dalam berbagai aspek seperti mengikuti instruksi, meringkas, menggunakan alat, dan menyusun ulang perintah.
"Llama terus berkembang dengan cepat, membuka banyak kemungkinan," ujar Zuckerberg.
Fitur Unggulan Llama 3.2:
- Pemahaman Gambar: Model Llama 3.2 dengan parameter 11B dan 90B mampu memahami diagram dan grafik, memberikan keterangan pada gambar, dan menentukan objek dari deskripsi bahasa alami. Misalnya, pengguna dapat bertanya pada bulan mana perusahaan mengalami penjualan terbaik, dan model akan memberikan jawaban berdasarkan grafik yang tersedia. Model dengan parameter lebih besar juga dapat mengekstrak detail dari gambar untuk membuat teks.
- Open Source: Seperti pendahulunya, Llama 3.2 tersedia secara open-source, memungkinkan pengembang untuk menggunakannya secara bebas dan gratis.
- Ukuran Model: Llama 3.2 hadir dalam dua versi: model kecil dengan 11 miliar parameter dan model sedang dengan 90 miliar parameter. Model dengan parameter lebih tinggi umumnya lebih akurat dan mampu menangani tugas yang lebih kompleks.
- Panjang Konteks: Llama 3.2 memiliki panjang konteks 128.000 token, memungkinkan pengguna untuk memasukkan teks yang cukup banyak (setara dengan ratusan halaman buku teks).
Aksesibilitas:
Model Llama 3.2 tersedia untuk diunduh di llama.com, Hugging Face, dan platform mitra Meta.
Kesimpulan
Dengan peluncuran Llama 3.2, Meta tampaknya berusaha mengejar ketertinggalan dalam perlombaan AI global. Pasalnya, pengembang AI lainnya, seperti OpenAI dan Google, telah merilis model AI multimodal sejak tahun lalu. Llama 3.2 menawarkan pendekatan open source untuk AI multimodal, memberikan kesempatan bagi para pengembang untuk bereksperimen dengan teknologi ini dan membangun aplikasi inovatif.