شرکت متا بهتازگی از جدیدترین مجموعه مدلهای هوش مصنوعی خود با نام Llama 4 رونمایی کرده است؛ آنهم در روزی غیرمنتظره یعنی شنبه. این نسخهی جدید، نقطه عطفی مهم در مسیر توسعه هوش مصنوعی این غول فناوری محسوب میشود و ویژگیهایی همچون معماری بهینهتر، عملکرد قدرتمندتر و تواناییهای گستردهتری را در حوزه پردازش متن، تصویر و ویدئو ارائه میدهد.
معرفی مدلهای جدید: Scout، Maverick و Behemoth
در مجموعهی جدید Llama 4 سه مدل اصلی معرفی شدهاند: Scout، Maverick و Behemoth. مدلهای Scout و Maverick در حال حاضر از طریق وبسایت رسمی Llama و پلتفرم Hugging Face در دسترس هستند، در حالیکه Behemoth هنوز در حال آموزش است.
متا برای اولین بار در این مدلها از معماری Mixture of Experts (MoE) استفاده کرده است. این معماری با تقسیم وظایف بین چندین مدل تخصصی، هم بهرهوری پردازشی را افزایش میدهد و هم پاسخدهی سریعتری دارد. به عنوان مثال، مدل Maverick با وجود داشتن ۴۰۰ میلیارد پارامتر، تنها از ۱۷ میلیارد پارامتر فعال در آن واحد بهره میبرد که در بین ۱۲۸ مدل تخصصی تقسیم شدهاند. Scout نیز با ۱۶ مدل تخصصی و ۱۰۹ میلیارد پارامتر، گزینهای سبکتر و مناسب برای اجرا روی یک کارت گرافیک Nvidia H100 است.
مدل Behemoth، سنگینترین عضو این مجموعه، دارای ۲۸۸ میلیارد پارامتر فعال و نزدیک به دو تریلیون پارامتر کلی است و به سختافزار بسیار قدرتمندی نیاز دارد. طبق اعلام متا، Behemoth در ارزیابیهای داخلی، عملکرد بهتری نسبت به مدلهای پیشرفتهای مانند GPT-4.5 و Claude 3.7 Sonnet در حل مسائل علمی و ریاضی داشته است.
عملکرد و کاربردهای مدلها
بر اساس آزمایشهای داخلی متا، مدل Maverick برای استفادههای عمومی مانند دستیارهای هوشمند، تولید محتوا، تحلیل کد و تعامل چندزبانه بسیار مناسب است. مدل Scout نیز در خلاصهسازی اسناد و تحلیل پایگاههای بزرگ کدنویسی برتری دارد. نکته قابل توجه درباره Scout، قابلیت پردازش تا ۱۰ میلیون توکن است، که به آن امکان میدهد با اسناد بسیار طولانی یا چندین تصویر همزمان کار کند.
توسعه سریع Llama 4 تحت تأثیر رقابت با آزمایشگاه هوش مصنوعی DeepSeek در چین بوده است. این آزمایشگاه موفق شد مدلهای متنبازی را عرضه کند که از نظر کیفیت و کارایی با نسخههای قبلی Llama رقابت میکردند. متا در پاسخ، تیمهایی تخصصی برای تحلیل و بهینهسازی روشهای خود تشکیل داد.
محدودیتهای دسترسی و مجوز استفاده
در حال حاضر، مدلهای Llama 4 در دستیار هوشمند متا (Meta AI) در اپلیکیشنهایی مانند واتساپ، اینستاگرام و مسنجر در ۴۰ کشور فعال شدهاند. با این حال، قابلیتهای چندرسانهای فعلاً فقط برای کاربران انگلیسیزبان در ایالات متحده قابل استفاده است.
همچنین، کاربران یا شرکتهایی که در اتحادیه اروپا فعالیت میکنند، به دلیل محدودیتهای قانونی مرتبط با داده و هوش مصنوعی، مجاز به استفاده از این مدلها نیستند. شرکتهایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه نیز باید مجوز ویژهای از متا دریافت کنند که ممکن است پذیرفته یا رد شود.
تمرکز بر پاسخ به سوالات بحثبرانگیز
یکی از تفاوتهای جالب Llama 4 نسبت به نسل قبلی، آمادگی بیشتر برای پاسخ به سوالات سیاسی و اجتماعی حساس است. متا میگوید که این مدلها با دیدگاهی متعادلتر طراحی شدهاند تا کمتر از پاسخ دادن به سوالات بحثبرانگیز خودداری کنند و دیدگاههای متنوعتری را بازتاب دهند.
این تغییرات در حالی صورت گرفته که برخی چهرههای نزدیک به دولت پیشین آمریکا، از جمله ایلان ماسک، مدلهای هوش مصنوعی را به “جهتگیری سیاسی” متهم کردهاند. متا در پاسخ به این نگرانیها تلاش کرده مدلهایی تولید کند که پاسخهایی بیطرف، واقعی و کاربردی ارائه دهند.
جمعبندی
انتشار Llama 4 نشاندهنده تعهد جدی متا به پیشتازی در رقابت جهانی هوش مصنوعی است. ترکیب معماری نوآورانه، قدرت پردازش بالا و تواناییهای گسترده، این مدلها را به ابزاری قدرتمند برای توسعهدهندگان و کسبوکارها تبدیل میکند. با این حال، محدودیتهای مجوز و قوانین منطقهای، ممکن است دسترسی به آن را در برخی کشورها محدود کند.
بدون شک، Llama 4 آغازگر فصل جدیدی در رقابت میان غولهای هوش مصنوعی است؛ فصلی که در آن قدرت، دقت و دسترسی همزمان اهمیت دارند.