پاسخ گوگل به GPT-4 جمینی است: «تواناترین مدلی که تا به حال ساخته ایم»

جایگاه OpenAI در بالای توده هوش مصنوعی مولد ممکن است به پایان برسد زیرا گوگل رسماً در روز چهارشنبه توانمندترین مدل زبان بزرگ خود را که تا به امروز نامگذاری شده است معرفی کرد. . ساندار پیچای، مدیرعامل این شرکت در نوشت: این اولین مدل از «نسل جدیدی از مدل‌های هوش مصنوعی است که از نحوه درک و تعامل مردم با جهان الهام گرفته شده است». .

از زمان برنامه‌ریزی هوش مصنوعی برای بازی‌های رایانه‌ای در دوران نوجوانی و در طول سال‌هایی که به عنوان محقق علوم اعصاب تلاش می‌کردم عملکرد مغز را درک کنم، همیشه بر این باور بوده‌ام که اگر بتوانیم ماشین‌های هوشمندتری بسازیم، می‌توانیم از آن‌ها برای نفع بشریت استفاده کنیم. پیچای ادامه داد: راه های باورنکردنی.

نتیجه همکاری گسترده بین بخش‌های DeepMind و تحقیقات گوگل، جمینی دارای تمامی زنگ‌ها و سوت‌هایی است که ژنراتورهای پیشرفته ارائه می‌دهند. "قابلیت های آن تقریباً در هر حوزه ای پیشرفته است." پیچای اعلام کرد.

این سیستم از ابتدا به عنوان یک هوش مصنوعی چندوجهی یکپارچه توسعه یافته است. بسیاری از مدل‌های پایه می‌توانند اساساً شامل گروه‌هایی از مدل‌های کوچک‌تر باشند که همگی در یک پوشش سنگی چیده شده‌اند، با هر مدل جداگانه برای انجام عملکرد خاص خود به عنوان بخشی از کل بزرگ‌تر. همه اینها برای توابع کم عمق مانند توصیف تصاویر خوب است، اما برای کارهای استدلالی پیچیده چندان خوب نیست.

پیچای گفت، گوگل، برعکس، Gemini را از قبل آموزش داده و به دقت تنظیم کرده است، “از ابتدا بر روی روش های مختلف” به آن اجازه می دهد “به طور یکپارچه انواع ورودی ها را از پایه درک و استدلال کند، بسیار بهتر از مدل های چندوجهی موجود.” توانایی دریافت همه این اشکال داده‌ها به‌طور هم‌زمان باید به Gemini کمک کند تا در موضوعات چالش‌برانگیزتر، مانند فیزیک، پاسخ‌های بهتری ارائه دهد.

جوزا می تواند کد کند خوب گزارش شده است که در زبان های برنامه نویسی محبوب از جمله Python، Java، C++ و Go مهارت دارد. گوگل حتی از نسخه تخصصی Gemini برای ایجاد AlphaCode 2، جانشین آن استفاده کرده است . به گفته این شرکت، AlphaCode 2 دو برابر سوالات چالشی قبلی خود را حل کرده است که عملکرد آن را بالاتر از ۸۵ درصد شرکت کنندگان در مسابقه قبلی قرار می دهد.

در حالی که گوگل فوراً تعداد پارامترهایی را که Gemini می‌تواند استفاده کند به اشتراک نمی‌گذارد، این شرکت انعطاف‌پذیری عملیاتی و توانایی این مدل را برای کار در فاکتورهای شکلی از مراکز داده بزرگ گرفته تا دستگاه‌های تلفن همراه محلی تبلیغ کرد. برای به انجام رساندن این شاهکار تحول آفرین، Gemini در سه اندازه در دسترس است: Nano، Pro و Ultra.

جای تعجب نیست که نانو کوچکترین در میان سه گانه است و عمدتاً برای کارهای روی دستگاه طراحی شده است. Pro گام بعدی است، یک پیشنهاد همه کاره تر از Nano، و به زودی در بسیاری از محصولات موجود Google، از جمله Bard، ادغام خواهد شد.

از چهارشنبه، Bard شروع به استفاده از یک نسخه تنظیم شده ویژه Pro می کند که گوگل قول داده است “استدلال، برنامه ریزی، درک و بیشتر پیشرفته تر” را ارائه دهد. چت بات بهبودیافته Bard در همان ۱۷۰ کشور و منطقه ای که Bard معمولی در حال حاضر موجود است در دسترس خواهد بود و طبق گزارش ها، این شرکت قصد دارد در سال ۲۰۲۴ در دسترس بودن نسخه جدید را افزایش دهد. سال آینده با ورود Gemini Ultra، گوگل نیز این کار را انجام خواهد داد. Bard Advanced را معرفی کنید، هوش مصنوعی حتی قوی تر با ویژگی های اضافه شده.

قابلیت‌های Pro همچنین از طریق تماس‌های API از طریق Google AI Studio یا Google Cloud Vertex AI قابل دسترسی خواهند بود. جستجو (به طور خاص SGE)، تبلیغات، کروم و هوش مصنوعی Duet همچنین عملکرد Gemini را در ویژگی های خود در ماه های آینده یکپارچه خواهند کرد.

Gemini Ultra حداقل تا سال ۲۰۲۴ در دسترس نخواهد بود، زیرا طبق گزارش‌ها به موارد اضافی نیاز دارد قبل از انتشار برای «انتخاب مشتریان، توسعه‌دهندگان، شرکا و کارشناسان ایمنی و مسئولیت» برای آزمایش و بازخورد پاک شود.» اما زمانی که Ultra رسید، قول می‌دهد که برای توسعه بیشتر هوش مصنوعی بسیار قدرتمند باشد.

این مقاله در ابتدا در Engadget در https://www.engadget.com/googles-answer-to-gpt-4-is-gemini-the-most-capable-model-weve-ever-built-150039571.html?src منتشر شد. = rss

منبع: https://www.engadget.com/googles-answer-to-gpt-4-is-gemini-the-most-capable-model-weve-ever-built-150039571.html?src=rss

دیدگاهتان را بنویسید لغو پاسخ