آیا لاما ۳ می‌تواند دنیای مدل‌های زبانی را متحول کند؟ 

چندی قبل بود که OpenAI از GPT-4o رونمایی کرد و گوگل نیز طی رویداد I/O 2024 از حضور جمینای در مرورگر کروم خبر داد. بااین‌حال بازیگر دیگری که نباید فراموش کنیم، مدل زبانی بزرگ متا، یعنی Llama 3 است. مدل زبانی متا توسط تعدادی زیادی از کاربران استفاده می‌شود و متن‌باز بودن آن در کنار سایر قابلیت‌ها موجب شده است تا رقیب جدی سایر پلتفرم‌ها مانند ChatGPT و جمینای نام بگیرد. همچنین برخی از توسعه‌دهندگان، لاما ۳ را در برخی زمینه‌ها برتر از سایر رقبا می‌دانند و طبق بنچمارک‌هایی که از آن در پردازش محاسبات، ریاضیات و دانش عمومی منتشر شده، عملکرد مدل زبانی جدید متا را سریع‌تر و دقیق‌تر ارزیابی می‌کنند.

دسترسی عموم کاربران به لاما ۳

هنگام رونمایی از ChatGPT، تنها تعداد کمی از کاربران با این مدل زبانی آشنا بودند و این چت‌بات به‌مرور زمان و با عملکرد خیره‌کننده‌اش، توانست طیف عظیمی از کاربران را در مدت زمان کوتاهی جذب خود کند. اما برخلاف ChatGPT، لاما ۳ در شبکه‌های مجازی متا مانند اینستاگرام، فیس‌بوک و واتس‌اپ در دسترس خواهد بود و میلیاردها کاربر از خدمات آن بهره خواهند برد. در نتیجه برنامه‌ریزی درست و استفاده از این ظرفیت بالای کاربری، می‌تواند لاما ۳ را جلوتر از رقیبانش به‌عنوان بهترین مدل زبانی حال‌حاضر معرفی کند.

آیا لاما ۳ می‌تواند دنیای مدل‌های زبانی را متحول کند؟ 

کاملاً رایگان

تجربه نشان داده که متا عجله چندانی برای درآمدزایی از سرویس‌‌های خود ندارد، برخلاف دیگر شرکت‌ها که به‌ علت سرمایه‌گذاری‌های هنگفت در این زمینه، به بازگشت نسبتاً سریع سرمایه‌شان فکر می‌کنند. 

متا با ساخت زیرساخت‌های مناسب برای نگهداری از داده‌ها و درآمدزایی از خدمات مختلف خود، می‌تواند لاما ۳ را رایگان در اختیار عموم کاربرانش قرار دهد. همچنین متا با سرمایه‌گذاری‌های بیشتر در آینده، قدرت محاسباتی مدل زبانی خود را افزایش خواهد داد تا کاربران به‌صورت رایگان به این مدل زبانی دسترسی داشته باشند.

لاما ۳، مدل زبانی متن‌باز

اگرچه عموم کاربران به هزینه اشتراک این مدل‌ها توجه می‌کنند؛ اما توسعه‌دهندگان متن‌باز بودن مدل‌های زبانی را یک مزیت می‌دانند. درنتیجه لاما ۳ نیز به‌عنوان یک مدل‌زبانی متن‌باز این اجازه را به توسعه‌دهندگان می‌دهد تا بتوانند نحوه اجرای دستورات را در این مدل زبانی ببینند و سپس تغییرات مدنظرشان را اعمال کنند. درنتیجه متخصصان بیشتری در توسعه لاما ۳ نقش خواهند داشت و روند گسترش و تقویت این مدل زبانی با سرعت بیشتری پیش خواهد رفت.

عملکرد سازگار و بهینه لاما ۳

بسیاری از مدل‌های زبانی فعلی علی‌رغم عملکرد مناسب، وابستگی بالایی به پردازش و قدرت محاسباتی دارند؛ بدین‌‌ معنی که این مدل‌ها به منابع قدرتمندی برای پردازش محاسبات وابسته‌اند که گاهاً این موضوع نه‌تنها در آموزش مدل‌ها، بلکه در پردازش پاسخ‌ها نیز آن‌ها را با مشکل مواجه می‌کند و تأخیر در پاسخ‌دهی را به‌همراه دارد. 

اما لاما ۳ را می‌توان از این قضیه مستثناء دانست؛‌ زیرا این مدل قادر است تا روی سخت‌افزار لپ‌تاپ‌های معمولی نیز اجرا شود و راهکارهایی برای کاهش بار محاسباتی ارائه دهد. درحال‌حاضر این مدل زبانی از ۷۰ میلیارد پارامتر در ارائه پاسخ‌های خود استفاده می‌کند، درحالی‌که نسخه‌های داخلی لاما از حداکثر ۴۰۰ میلیارد پارامتر بهره‌مندند. درنتیجه این فناوری نشان‌ می‌دهد که احتمالاً در آینده نزدیک می‌توانیم توانایی‌های هوش مصنوعی را در دستگاه‌های کوچک‌تری مانند موبایل‌ها، عینک‌های هوشمند و هدست‌های VR ببینیم.

جمع‌بندی

اگرچه لاما ۳ کمی متفاوت از سایر مدل‌های زبانی عمل می‌کند، اما هنوز از قابلیت‌های کلیدی که رقبایش ارائه می‌دهند، محروم است. این مدل زبانی هنوز متن‌محور است و نمی‌تواند نقش یک هوش مصنوعی چندوجهی را ایفا کند. همچنین قادر به پردازش ویدیو، صدا و تصاویر نیست و به دستورات صوتی کاربران نیز پاسخ نمی‌دهد. علاوه‌براین، کاربران تنها با زبان انگلیسی می‌توانند با لاما ۳ ارتباط برقرار کنند. اما این مشکلات نیز به‌زودی رفع خواهند شد تا لاما ۳ بتواند با پتانسیل بالاتری درزمینه پردازش محاسبات و پاسخ‌گویی به کاربران عمل کند و کمی متفاوت از سایر رقبا ظاهر شود.


منبع: https://digiato.com/artificial-intelligence/can-llama-3-revolutionize-world-of-language-models

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *