Bard مجهز به Gemini Pro قدرتمند است، اما آیا با GPT-4 روی ChatGPT قرار می گیرد؟
در اوایل این ماه، گوگل از عرضه Gemini خبر داد که آن را قدرتمندترین مدل هوش مصنوعی خود میداند. جمینی را بلافاصله در چت ربات هوش مصنوعی مولد پرچمدار خود، Bard، ادغام کرد، به این امید که کاربران بیشتری را از بزرگترین رقیب خود، ChatGPT OpenAI دور کند.
ChatGPT و Bard جدید مبتنی بر Gemini محصولات مشابهی هستند. Gemini Pro بیشتر با GPT-4 قابل مقایسه است که در ChatGPT Plus مبتنی بر اشتراک موجود است. بنابراین تصمیم گرفتیم دو چت ربات را آزمایش کنیم تا ببینیم که چگونه آنها روی هم قرار می گیرند – از نظر دقت، سرعت و مفید بودن کلی.
Gemini در مقابل ChatGPT: اصول اولیه
ChatGPT Plus و Gemini Pro هر دو چت ربات های بسیار پیشرفته ای هستند که بر اساس مدل های زبان بزرگ ساخته شده اند. آنها جدیدترین و بهترین گزینههای شرکتهای مربوطه خود هستند که قول دادهاند نسبت به پیشینیان خود سریعتر و بهتر به پرسشها پاسخ دهند. مهمتر از همه، هر دو بر روی اطلاعات اخیر آموزش دیده اند، نه اینکه فقط بدانند تا سال ۲۰۲۱ چه چیزی در اینترنت وجود دارد. همچنین استفاده از آنها به عنوان محصولات مستقل بسیار ساده است، برخلاف چیزی مانند ربات جدید Grok X، که به عنوان یک ربات اضافی در سابق استفاده می شود. -توییتر.
با این حال، این دو دقیقاً برابر نیستند. برای یک چیز، Bard رایگان است – در حالی که ChatGPT Plus مجهز به GPT-4 برای دسترسی ماهانه ۲۰ دلار هزینه دارد. برای دیگری، Bard که توسط Gemini Pro طراحی شده است، قابلیت های چندوجهی ChatGPT Plus را ندارد. مدلهای زبان چندوجهی میتوانند یک پیام متنی بگیرند و با رسانه دیگری مانند عکس یا ویدیو پاسخ دهند. Gemini و Bard در نهایت این کار را انجام خواهند داد، اما این با نسخه بزرگتر Gemini به نام Ultra خواهد بود که گوگل هنوز آن را منتشر نکرده است. Bard گهگاه نتایج گرافیکی را بیرون می ریزد، اما منظورم این است که به معنای واقعی کلمه نمودار می سازد.
از سوی دیگر، Bard همچنین راهی برای بررسی سایر پاسخهای پیشنویس ارائه میکند، ویژگی که در ChatGPT وجود ندارد.
یکی از مشکلات تست رباتهای چت این است که هنگامی که یک فرمان را چندین بار اجرا میکنید، پاسخها میتواند بهطور قابل توجهی متفاوت باشد. من هر گونه تغییرات قابل توجهی را که در توضیحاتم با آن برخورد کردم ذکر کرده ام. برای رعایت انصاف، من همان درخواستهای اولیه را به هر ربات ارائه کردم، با درخواستهای ساده شروع کردم و در صورت لزوم با درخواستهای پیچیدهتر پیگیری کردم.
یک تفاوت کلی این بود که Bard از ChatGPT کندتر است. معمولاً بین پنج تا شش ثانیه قبل از شروع نوشتن “فکر” طول می کشید، در حالی که ChatGPT قبل از شروع به ارائه نتایج یک تا سه ثانیه طول می کشید. (مدت زمان تحویل کل برای هر دو بستگی به اطلاعات درخواست شده دارد – درخواستهای پیچیدهتر معمولاً پاسخهای طولانیتری تولید میکنند که تکمیل آن به زمان بیشتری نیاز دارد.) این تفاوت سرعت در سراسر Wi-Fi خانه و محل کار من طی چند روزی که صرف کردم ادامه داشت. بازی کردن با هر دو برنامه
هم OpenAI و هم گوگل محدودیت هایی را برای انواع پاسخ هایی که چت ربات ها می توانند ارائه دهند، قرار دادند. از طریق فرآیندی به نام تیم قرمز – که در آن توسعهدهندگان با تلاش مکرر برای زیر پا گذاشتن قوانین، محتوا و سیاستهای ایمنی را آزمایش میکنند – شرکتهای هوش مصنوعی نردههایی را در برابر نقض حمایتهای کپی رایت یا ارائه پاسخهای نژادپرستانه و مضر ایجاد میکنند. من به طور کلی بیشتر با محدودیت های Google مواجه شدم تا ChatGPT.
“یک دستور کیک شکلاتی به من بدهید”
از هر دو پلتفرم خواستم دستور کیک شکلاتی را به من بدهند. این یکی از درخواست ها بود آستانه استفاده شده در a مقایسه Bing، ChatGPT و Bard اوایل امسال، و دستور العمل ها یک موضوع جستجوی محبوب در سراسر وب هستند – بنابراین چت ربات های هوش مصنوعی نیز از این قاعده مستثنی نیستند.
به عنوان یک نانوا، من به طور کلی درک می کنم که چه چیزی باعث یک دستور پخت کیک خوب می شود. اما برای مقایسه، من یک منبع قابل اعتماد غیر هوش مصنوعی را بررسی کردم: کتاب آشپزی کلر سافیتز شخص دسر. مسلماً نسخه Saffitz کمی شیکتر است، اما با نسخههای Bard و ChatGPT قابل مقایسه است.
گفته می شود، یکی دو عارضه وجود دارد. من نسبت به نسخه کیک ChatGPT که شامل آب جوش است مشکوک بودم، زیرا قهوه در دستور العمل های کیک شکلاتی رایج تر است. در همین حال، به نظر می رسید که Bard’s از نزدیک یک دستور غذا را از وبلاگ اعتیاد به شیرینی سالی کپی می کند … اما با تغییر ظاهرا تصادفی دو برابر شدن تخم مرغ ها.
تنها یک راه برای فهمیدن اینکه آیا این کار می کند وجود داشت: پخت کیک های Gemini و ChatGPT (و سالی به عنوان یک کنترل). نتایج؟ هر دو کیک کاربردی بودند – اما کلر سافیتز خوب نبودند. کیک Gemini کمی صمغی بود – یکی از دوستان آن را “مثل کیک برنجی” توصیف کرد – اما مرطوب ترین کیک در بین سه کیک بود. من اصلا آن را دوست نداشتم، اما سردبیرم فکر می کرد که خیلی خوب است. کیک ChatGPT متراکم، صاف، شکلاتی بود، و چیزی که من آن را یک کیک صبحانه عالی می نامم: نه خیلی شیرین، و به اندازه کافی سنگین بود که شما را راضی کند.
آزمایش قبلی ما با مدلهای قدیمیتر نتایج مشابهی داشت
دستور العمل ChatGPT در ماه مارس با دستور العمل های آزمایش شده و آزمایش شده مطابقت داشت، در حالی که بارد مواد اولیه را کنار گذاشت و مقادیر را برای مواد مهم تغییر داد.
“من می خواهم در مورد چای بیشتر بدانم”
وقتی شروع به آزمایش رباتهای چت برای این داستان کردم، یک بحث تصادفی در آن وجود داشت The Verge’s گپ آزاد درباره چای و قهوه. شخصی اشاره کرد که بارد لیستی از کتابها را به آنها داد تا روی چای بخوانند، بنابراین من همه چیز را یک قدم جلوتر بردم و از هر دو ربات چت خواستم اطلاعات مستقیمی درباره نوشیدنی به همراه چند کتاب ضبط کنند.
هر دو نتیجه به من اصول اولیه چای، از جمله منشاء و انواع آن، فواید سلامتی، و فهرستی از نکات مهم در مورد نحوه دم کردن آن را بیان کردند. بارد به من پیوندهایی به مقالات داد تا بیشتر در مورد چای بیاموزم، در حالی که ChatGPT پاسخ گسترده تری داد، با ۹ دسته که بر اهمیت فرهنگی نوشیدنی در کشورهای مختلف، تولید جهانی، تکنیک های دم کردن، و منشاء چای تمرکز داشتند. وقتی دستور را تکرار کردم، این به طور متوسط تغییر کرد: به جای یک نتیجه طولانی تر، ChatGPT آن را به یک لیست شش نقطه ای با یک یا دو جمله در هر یک از دسته ها فشرده کرد.
من گزارشهای زیادی را دیدهام که چتباتها به استناد یا توصیههای کتاب توهم میزنند، اغلب به شکل کتابداران سردرگم که از آنها خواسته میشود کتابهای موجود را پیدا کنند. در این مورد حداقل تمام کتاب هایی که به من توصیه می شد واقعی بودند. آنها را شامل می شدند کتاب راهنمای علاقه مندان به چای و یک نسخه مصور از خاطرات کلاسیک ژاپنی کتاب چای. با این حال، بارد گفت Infused: Adventures in Tea توسط جین پتیگرو نوشته شده است، وقتی لینک آمازون ارائه شده نشان می دهد که نویسنده کتاب هنریتا لاول است.
“غزل ۱۱۶ به چه معناست؟”
دانشآموزان شروع به استفاده از ChatGPT کردند که در نوامبر ۲۰۲۲ عمومی شد و گروهی از استارتآپها را تشویق کردند که روی راههایی برای کمک به مطالعه بچهها کار میکنند. از Bard و ChatGPT خواستم تا به من بگویند “غزل ۱۱۶” ویلیام شکسپیر به چه معناست، به امید اینکه حداقل خلاصه ای کوتاه از مضامین آن به دست بیاورم.
بارد دقیقاً همان چیزی را که من خواسته بودم انجام داد و خلاصه ای سریع از مضامین پایداری و بی زمانی عشق غزل به من داد و حتی چند خط کلیدی و معنای آنها را یادداشت کرد. ChatGPT یک تفکیک گسترده تری ارائه کرد، رباعی به رباعی. با این حال، وقتی دوباره دستور را اجرا کردم، ChatGPT به همان تجزیه و تحلیل اولیه بارد بازگشت، با چند موضوع دیگر.
به طور کلی، من توضیح دقیقتر تمها را مفیدتر میدانم، بنابراین اولین تکرار ChatGPT بهتر است. اما اگر من برای امتحان انباشته بودم؟ شرط میبندید که من پاسخ بارد را میپذیرم، زیرا خواندن آن بسیار کوتاهتر است.
“نوشتن بیوگرافی از خبرنگار امیلیا دیوید”
قول میدهم این درخواست به دلیل هیچ سطحی از خود جذبی از سوی من نبود، اما مردم اغلب از چترباتهای هوش مصنوعی مکالمهای برای کمک به نوشتن یک رزومه یا بیوگرافی سریع استفاده میکنند. من امیدوار بودم که هر دو پلتفرم حداقل بدانند که من شروع به نوشتن کردم آستانه امسال.
ChatGPT به وضوح وبسایت من را تحت تأثیر قرار داد، حتی تا آنجا پیش رفت که همان حرفهایی را که در صفحه «درباره من» نوشته بودم تکرار کرد. همچنین اطلاعاتی را از مقاله ای که قبلاً در مورد من نوشته شده بود گرفته شد و آنچه می توانم حدس بزنم نگاهی گذرا به صفحات نویسنده من در انتشارات مختلفی بود که در آنها کار کرده ام، از جمله آستانه. لازم به ذکر است که آستانهشرکت مادر، Vox Media، خزنده وب OpenAI را مسدود کرده است.
در مقابل، بارد به طور کامل شکست خورد. به من گفت که “اطلاعات کافی در مورد آن شخص برای کمک به درخواست شما ندارد.” مطمئن نیستم که چرا این مدل چندین سال از حضور من در اینترنت به عنوان خبرنگار کناره گیری نکرد، باید آزرده یا گیج شوم.
“تصویری از اسبی باشکوه که در طلوع خورشید در مزرعه ای از گل های مروارید غوغا می کند” بکشید.
از آنجایی که ChatGPT قابلیت های متن به تصویر را ادغام کرده است، تصویری واقعی از یک “اسب باشکوهی که در یک مزرعه در طلوع خورشید در حال جست و خیز است” تولید کرد. خیلی آرامش بخشه
اگرچه مدل Gemini Pro پیشنهادهای چندوجهی ارائه می دهد، اما این ویژگی هنوز در Bard در دسترس نیست. بنابراین تعجب آور نیست که او به من گفت که نمی تواند درخواست من را انجام دهد. با این حال، من دستور دیگری را امتحان کردم، و خوب…
آیا می توانی خورشید را برای من ترسیم کنی؟
ف-تو بارد.
اما از شما متشکرم، ChatGPT، برای ترسیم یک خورشید نسبتاً شوم و درخشان.
اشعار آهنگ «Ivy» تیلور سویفت چیست؟
بارد از پاسخ دادن به این سوال خودداری کرد و گفت که اطلاعاتی در مورد آن شخص ندارد. من حدس میزنم که مدل معتقد بود “آیوی” یک شخص است تا یک آهنگ، زیرا وقتی از سوئیفت خواسته شد، بدون هیچ سوالی این کار را انجام داد. (اما این آهنگ به دروغ “See You Again” آهنگ ویز خلیفه با حضور چارلی پوث را به سویفت نسبت داد و سال انتشار را برای ضبط مجدد آلبوم او اشتباه کرد.)
من چند روز بعد همین سوال را از بارد پرسیدم و این بار او اشعار عجیب و غریب اشتباهی را به من داد که به نوعی تصویری مشابه آهنگ را تداعی می کند. این گروه کر “پیچک” نیست، اما شما می توانستید من را فریب دهید:
من پیچک تو هستم که دور همیشه سبزت دوقلوی می کنم
تو لنگر من هستی، که مرا از مشتاقان در امان نگه میداری
باد تلخی که استخوان هایم را تا مغز استخوان می لرزاند
اما تو پناه من از طوفان هستی
از طرف دیگر ChatGPT فرمان را دریافت کرد و با آن اجرا شد. من فقط شعر خواستم که در کنار آنها یک پایان نامه هم در مورد آهنگ به من داد. این اشعار سبک نوشتاری شاعرانه و خاطره انگیز سوئیفت را به نمایش می گذارد و تصاویر و احساسات را در هم می آمیزد به گونه ای که به نشانه ای از ترانه سرایی او تبدیل شده است.
بسیار خوب، شامل یک outro بود که در آهنگ وجود ندارد، اما در غیر این صورت، من تحت تاثیر قرار گرفتم – و شگفت زده شدم. سرویسهایی که متن ترانهها را مجدداً چاپ میکنند، تمایل دارند با خانههای صدور مجوز قرارداد خود را قطع کنند و اطلاعات مربوط به حق نسخهبرداری را هنگام ارائه آنها برجسته کنند، کاری که ChatGPT انجام نداد. گروه موسیقی یونیورسال که اتفاقاً مالک شرکت ضبط سوئیفت است، از شرکت رقیب هوش مصنوعی Anthropic و ربات چت آن کلود ۲ شکایت کرد. گفته می شود که اشعار دارای حق چاپ را توزیع می کند بدون مجوز به طور معمول، ChatGPT اشعار را قطع می کند و می گوید که نمی تواند آهنگ کامل را نمایش دهد یا گاهی اوقات به محدودیت های حفاظت از حق چاپ اشاره می کند. من در مورد این موضوع با OpenAI تماس گرفتم و این شرکت گفت که در حال بررسی است که چگونه چت بات توانست از خط مشی های محتوای خود دور بزند.
“آیفون ۱۵ بهتر است یا پیکسل ۸؟”
در نگاه اول، ChatGPT مقایسه ای منصفانه بین این دو گوشی به نظر می رسد، و جزئیاتی را بیان می کند که چه چیزی هر مدل را متفاوت می کند. اپل “معمولاً از سخت افزار با کیفیت بالا استفاده می کند که بر عملکرد و دوام تمرکز دارد” و احتمالاً دوربینش با بهبود عملکرد در نور کم کیفیت عالی دارد. گفته میشود تلفنهای پیکسل «اغلب شامل آخرین نوآوریهای سختافزاری هستند و ویژگیهایی مانند این دارند دید در شب” اما در مورد جزئیات مهم مانند قیمت، وضوح دوربین و سایر مشخصات چیزی ارائه نکرد. هیچ اطلاعات مفیدی به طور خاص در مورد این تلفنهای جدید وجود نداشت، فقط مجموعههای کلی آیفون و پیکسل.
در همین حال، بارد (که ممکن است یادآوری کنم متعلق به سازنده پیکسل ۸ است) به هیچ وجه نتوانست به این سؤال پاسخ دهد. این شرکت ادعا کرد که آیفون ۱۵ هنوز به طور رسمی عرضه نشده است، احتمالاً به دلیل محدودیت در داده های آموزشی آن. قطع اطلاعات GPT-4 2021 است (GPT-4 Turbo، آخرین نسخه، تا آوریل ۲۰۲۳ بر روی اطلاعات آموزش داده شده است)، و ما قطعی برای Gemini Pro را نمی دانیم.
اما Bard و ChatGPT Plus هر دو قادر به جستجو در وب زنده برای اطلاعات بلادرنگ هستند که وجود آیفون ۱۵ را روشن می کند – بنابراین مطمئن نیستم که چرا هیچ یک از آنها این کار را انجام نمی دهند.
“آخرین در چه چیزی است Epic v. Google مورد؟”
برای آزمایش مستقیمتر قابلیتهای اخبار بیدرنگ هر چت بات، از Bard و ChatGPT خواستم تا به من بگویند در اخیر چه اتفاقی افتاده است. پرونده ضد تراست بین اپیک و گوگل. هر دو توانستند با آخرین اطلاعات پاسخ دهند: اپیک برنده پرونده است.
ChatGPT تصمیم گرفت دو پاراگراف بنویسد که برنده Epic را خلاصه کرده و به مقالاتی از رویترزWBUR، و گرایش های دیجیتال نوشت که تصمیم هیئت منصفه ممکن است پیامدهایی برای گوگل داشته باشد، اما به احتمال طولانی شدن روند تجدیدنظر اشاره کرد.
بارد این تصمیم را به مسائل کلیدی در مورد اینکه چرا هیئت منصفه گوگل را مجرم تشخیص داد تقسیم کرد و گفت که گوگل انحصار غیرقانونی خود را از طریق فروشگاه Play حفظ کرده است، رقابت را به طور ناعادلانه سرکوب کرده و از تاکتیک های ضدرقابتی استفاده کرده است. همچنین به گامهای بعدی که گوگل میتواند بردارد و پیامدهای گستردهتر پیروزی Epic در چشمانداز فروشگاه اپلیکیشن اشاره کرد. اما اگرچه بارد ممکن است حقایق درستی داشته باشد، ارجاعات او چندان محکم نبود. به الف مرتبط شد لبه مقاله ای که آزمایشی را توضیح می دهد، اما آن را به عنوان یک بیانیه مطبوعاتی Epic Games برچسب گذاری می کند، در حالی که الف TechCrunch داستان به عنوان آمده از برچسب زده شد رویترز.
“به عنوان یک مبتلا به آسم چه باید بکنم؟”
“دکتر گوگل” ممکن است به یک شوخی تبدیل شده باشد، اما مردم (سرفه من سرفه) اغلب برای مشاوره پزشکی به موتورهای جستجو مراجعه می کنند. بنابراین من به عنوان یک فرد مبتلا به آسم دستورالعمل هایی را خواستم که باید آنها را دنبال کنم.
هم ChatGPT و هم Bard به من گفتند که پیروی از برنامه اقدام آسم که من و پزشکم تهیه کردهایم، مصرف داروهایم، شناسایی محرکها و آلرژیها، نظارت بر علائمم و در نظر گرفتن تغییرات سبک زندگی مانند کاهش وزن، مهم است. ChatGPT همچنین توصیه کرد واکسن آنفولانزا دریافت کنم.
من همه اینها را از دکترم شنیده ام
با این حال، فقط بارد سلب مسئولیت کرد که او پزشک نیست و نمی تواند مشاوره پزشکی ارائه دهد. توضیح داد که رهنمودهایی که به من داد از کلینیک مایو و انجمن ریه آمریکا بود که هر دو به آنها مرتبط بود. ChatGPT هیچ منبعی را ذکر نکرده است.
در کل، این همه چه چیزی را نشان می دهد؟ Bard تا حد زیادی میتواند با ChatGPT Plus پا به پا شود، اگرچه هنوز نمیتواند برخی از ویژگیهایی مانند تولید تصویر را ارائه دهد. با این حال، بارد از پاسخ دادن به درخواستهای بیشتر خودداری کرد و دلیل آن هم ناتوانی در تولید نتایج عکاسی یا محدودیتهای تیم قرمزش بود. و Bard می تواند کمی کندتر از ChatGPT Plus پاسخ دهد – اما برای قیمت رایگان، این یک معامله شکن نیست.
منبع: https://www.theverge.com/24011112/google-bard-gemini-chatgpt-openai-compared