یک سال از زمانی که OpenAI ChatGPT را در جهان راه اندازی کرد و اصطلاحاتی مانند مدل بنیادی، LLM و GenAI را رایج کرد، می گذرد. با این حال، مزایای وعده داده شده از مولد هوش مصنوعی فن آوری هنوز هم به احتمال زیاد توسط کسانی که انگلیسی صحبت می کنند بیش از زبان های دیگر مشتق شده است.
بیش از ۷۰۰۰ زبان در جهان وجود دارد. با این حال، بزرگترین زبان مدلها (LLM) در زبان انگلیسی بسیار مؤثرتر عمل میکنند. به طور طبیعی، این تهدیدی برای تقویت تعصب زبانی در مورد دسترسی به دانش، تحقیق، نوآوری – و مزیت رقابتی برای مشاغل است.
در ماه نوامبر، Silo AI فنلاند باز چند زبانه خود را منتشر کرد اروپایی LLM Poro 34B با همکاری دانشگاه تورکو توسعه یافته است. Poro که در زبان فنلاندی به معنای گوزن شمالی است، بر روی قدرتمندترین ابررایانه اروپا LUMI در Kajani فنلاند آموزش دیده است. (جالب است که LUMI بر خلاف آموزش LLM معمولی بر روی معماری AMD اجرا می شود. Nvidia.)
همراه با Poro 1، این شرکت از برنامه ایست بازرسی تحقیقاتی رونمایی کرد که با تکمیل مدل، نقاط بازرسی را منتشر می کند (سه نقطه اول با مدل ماه گذشته اعلام شد).
اکنون، این شرکت از طریق شعبه خود SiloGen، بیش از ۵۰ درصد از مدل را آموزش داده و به تازگی دو بازرسی بعدی را در برنامه منتشر کرده است. با تکمیل این پنج نقطه بازرسی، Poro 34B بهترین عملکرد را برای زبانهای کممنبع مانند فنلاندی (در مقایسه با Llama، Mistral، FinGPT و غیره) نشان داده است – بدون اینکه عملکرد انگلیسی را به خطر بیندازد.
محقق Sampo Pyysalo از TurkuNLP می گوید که آنها انتظار دارند که این مدل را در چند هفته آینده به طور کامل آموزش دهند. به عنوان گام بعدی، این مدل از دیگر زبانهای نوردیک از جمله سوئدی، نروژی، دانمارکی و ایسلندی پشتیبانی خواهد کرد.
“برای این امر ضروری است حاکمیت دیجیتال اروپا دسترسی به مدل های زبانی همسو با ارزش ها، فرهنگ و زبان های اروپایی. پیتر سارلین، بنیانگذار و مدیر عامل Silo AI، به TNW گفت: «ما مفتخریم که میبینیم Poro بهترین عملکرد را در کلاس خود در زبانی مانند فنلاندی نشان میدهد. این یک گام طبیعی برای شروع با گسترش زبان های نوردیک است.”
علاوه بر این، SiloGen آموزش Poro 2 را آغاز کرده است. از طریق مشارکت با غیرانتفاعی LAION (شبکه باز هوش مصنوعی در مقیاس بزرگ)، چندوجهی بودن را به مدل اضافه خواهد کرد.
سارلین افزود: “به همین ترتیب طبیعی است که پورو را با دید گسترش دهیم.” مانند دادههای متنی، ما شاهد پتانسیل بزرگتری برای هوش مصنوعی مولد هستیم تا مقادیر زیادی از دادهها را با روشهای مختلف ادغام کند.»
LAION می گوید که “علاقه مند به پیشرفت زمینه یادگیری ماشین برای منافع بیشتر است.” مطابق با اهداف Silo AI برای ساخت مدل GenAI خود و ماموریت کلی LAION برای افزایش دسترسی به مدلهای ML در مقیاس بزرگ و مجموعههای داده، Poro 2 به صورت رایگان تحت مجوز Apache 2.0 در دسترس خواهد بود. این بدان معناست که توسعه دهندگان همچنین می توانند راه حل های اختصاصی را در بالا ایجاد کنند.
هوش مصنوعی Silo، که خود را “بزرگترین آزمایشگاه خصوصی هوش مصنوعی اروپا” می نامد، در سال ۲۰۱۷ با این ایده راه اندازی شد که اروپا به یک پرچمدار هوش مصنوعی نیاز دارد. این شرکت در هلسینکی فنلاند مستقر است و راهحلها و محصولات مبتنی بر هوش مصنوعی را برای فعال کردن دستگاههای هوشمند، وسایل نقلیه خودران، صنعت ۴٫۰ و شهرهای هوشمند میسازد. در حال حاضر، Silo AI بیش از ۳۰۰ کارمند دارد و همچنین دفاتری در سوئد، دانمارک، هلند و کانادا دارد.
منبع: https://thenextweb.com/news/silo-ai-checkpoint-mission-democratise-llms