کاربران Hugging Face که مدلهای هوش مصنوعی را آموزش میدهند همچنین میتوانند از قابلیتهای سختافزاری ارائهشده با Google Cloud، از جمله TPU، ماشینهای مجازی A3، مجهز به پردازندههای گرافیکی Nvidia H100 Tensor Core و C3 VM بهره ببرند.ادامه مطلب منبع: https://venturebeat.com/ai/hugging-face-teams-up-with-google-to-accelerate-open-ai-development/
دسته: model training
Tenyx قصد دارد مشکل فراموشی فاجعه بار LLM ها را برطرف کند
با استفاده از روش تنظیم دقیق Tenyx، شرکتها میتوانند از مدلهای زبان بزرگ بدون خطر «فراموشی فاجعهبار» استفاده کنند.ادامه مطلب منبع: https://venturebeat.com/ai/tenyx-aims-to-fix-llms-catastrophic-forgetting-problem/
مایکروسافت Orca 2 را منتشر کرد، یک جفت مدل زبان کوچک که عملکرد بهتری نسبت به همتایان بزرگتر دارد
هنگامی که بر روی ۱۵ معیار مختلف (در تنظیمات صفر شات) که جنبههایی مانند درک زبان و استدلال عقل سلیم را پوشش میدهند، آزمایش شد، مدلهای Orca 2 با مدلهای بزرگتر مطابقت یا عملکرد بهتری داشتند.ادامه مطلب منبع: https://venturebeat.com/ai/microsoft-releases-orca-2-a-pair-of-small-language-models-that-outperform-larger-counterparts/