جایگاه OpenAI در بالای توده هوش مصنوعی مولد ممکن است به پایان برسد زیرا گوگل رسماً در روز چهارشنبه توانمندترین مدل زبان بزرگ خود را که تا به امروز نامگذاری شده است معرفی کرد. . ساندار پیچای، مدیرعامل این شرکت در نوشت: این اولین مدل از «نسل جدیدی از مدلهای هوش مصنوعی است که از نحوه درک و تعامل مردم با جهان الهام گرفته شده است». .
از زمان برنامهریزی هوش مصنوعی برای بازیهای رایانهای در دوران نوجوانی و در طول سالهایی که به عنوان محقق علوم اعصاب تلاش میکردم عملکرد مغز را درک کنم، همیشه بر این باور بودهام که اگر بتوانیم ماشینهای هوشمندتری بسازیم، میتوانیم از آنها برای نفع بشریت استفاده کنیم. پیچای ادامه داد: راه های باورنکردنی.
نتیجه همکاری گسترده بین بخشهای DeepMind و تحقیقات گوگل، جمینی دارای تمامی زنگها و سوتهایی است که ژنراتورهای پیشرفته ارائه میدهند. "قابلیت های آن تقریباً در هر حوزه ای پیشرفته است." پیچای اعلام کرد.
این سیستم از ابتدا به عنوان یک هوش مصنوعی چندوجهی یکپارچه توسعه یافته است. بسیاری از مدلهای پایه میتوانند اساساً شامل گروههایی از مدلهای کوچکتر باشند که همگی در یک پوشش سنگی چیده شدهاند، با هر مدل جداگانه برای انجام عملکرد خاص خود به عنوان بخشی از کل بزرگتر. همه اینها برای توابع کم عمق مانند توصیف تصاویر خوب است، اما برای کارهای استدلالی پیچیده چندان خوب نیست.
پیچای گفت، گوگل، برعکس، Gemini را از قبل آموزش داده و به دقت تنظیم کرده است، “از ابتدا بر روی روش های مختلف” به آن اجازه می دهد “به طور یکپارچه انواع ورودی ها را از پایه درک و استدلال کند، بسیار بهتر از مدل های چندوجهی موجود.” توانایی دریافت همه این اشکال دادهها بهطور همزمان باید به Gemini کمک کند تا در موضوعات چالشبرانگیزتر، مانند فیزیک، پاسخهای بهتری ارائه دهد.
جوزا می تواند کد کند خوب گزارش شده است که در زبان های برنامه نویسی محبوب از جمله Python، Java، C++ و Go مهارت دارد. گوگل حتی از نسخه تخصصی Gemini برای ایجاد AlphaCode 2، جانشین آن استفاده کرده است . به گفته این شرکت، AlphaCode 2 دو برابر سوالات چالشی قبلی خود را حل کرده است که عملکرد آن را بالاتر از ۸۵ درصد شرکت کنندگان در مسابقه قبلی قرار می دهد.
در حالی که گوگل فوراً تعداد پارامترهایی را که Gemini میتواند استفاده کند به اشتراک نمیگذارد، این شرکت انعطافپذیری عملیاتی و توانایی این مدل را برای کار در فاکتورهای شکلی از مراکز داده بزرگ گرفته تا دستگاههای تلفن همراه محلی تبلیغ کرد. برای به انجام رساندن این شاهکار تحول آفرین، Gemini در سه اندازه در دسترس است: Nano، Pro و Ultra.
جای تعجب نیست که نانو کوچکترین در میان سه گانه است و عمدتاً برای کارهای روی دستگاه طراحی شده است. Pro گام بعدی است، یک پیشنهاد همه کاره تر از Nano، و به زودی در بسیاری از محصولات موجود Google، از جمله Bard، ادغام خواهد شد.
از چهارشنبه، Bard شروع به استفاده از یک نسخه تنظیم شده ویژه Pro می کند که گوگل قول داده است “استدلال، برنامه ریزی، درک و بیشتر پیشرفته تر” را ارائه دهد. چت بات بهبودیافته Bard در همان ۱۷۰ کشور و منطقه ای که Bard معمولی در حال حاضر موجود است در دسترس خواهد بود و طبق گزارش ها، این شرکت قصد دارد در سال ۲۰۲۴ در دسترس بودن نسخه جدید را افزایش دهد. سال آینده با ورود Gemini Ultra، گوگل نیز این کار را انجام خواهد داد. Bard Advanced را معرفی کنید، هوش مصنوعی حتی قوی تر با ویژگی های اضافه شده.
قابلیتهای Pro همچنین از طریق تماسهای API از طریق Google AI Studio یا Google Cloud Vertex AI قابل دسترسی خواهند بود. جستجو (به طور خاص SGE)، تبلیغات، کروم و هوش مصنوعی Duet همچنین عملکرد Gemini را در ویژگی های خود در ماه های آینده یکپارچه خواهند کرد.
Gemini Ultra حداقل تا سال ۲۰۲۴ در دسترس نخواهد بود، زیرا طبق گزارشها به موارد اضافی نیاز دارد قبل از انتشار برای «انتخاب مشتریان، توسعهدهندگان، شرکا و کارشناسان ایمنی و مسئولیت» برای آزمایش و بازخورد پاک شود.» اما زمانی که Ultra رسید، قول میدهد که برای توسعه بیشتر هوش مصنوعی بسیار قدرتمند باشد.
این مقاله در ابتدا در Engadget در https://www.engadget.com/googles-answer-to-gpt-4-is-gemini-the-most-capable-model-weve-ever-built-150039571.html?src منتشر شد. = rss
منبع: https://www.engadget.com/googles-answer-to-gpt-4-is-gemini-the-most-capable-model-weve-ever-built-150039571.html?src=rss