رقیب Google ChatGPT Bard تقریباً به همان اندازه خوب است – فقط کندتر

Bard مجهز به Gemini Pro قدرتمند است، اما آیا با GPT-4 روی ChatGPT قرار می گیرد؟

در اوایل این ماه، گوگل از عرضه Gemini خبر داد که آن را قدرتمندترین مدل هوش مصنوعی خود می‌داند. جمینی را بلافاصله در چت ربات هوش مصنوعی مولد پرچمدار خود، Bard، ادغام کرد، به این امید که کاربران بیشتری را از بزرگترین رقیب خود، ChatGPT OpenAI دور کند.

ChatGPT و Bard جدید مبتنی بر Gemini محصولات مشابهی هستند. Gemini Pro بیشتر با GPT-4 قابل مقایسه است که در ChatGPT Plus مبتنی بر اشتراک موجود است. بنابراین تصمیم گرفتیم دو چت ربات را آزمایش کنیم تا ببینیم که چگونه آنها روی هم قرار می گیرند – از نظر دقت، سرعت و مفید بودن کلی.

Gemini در مقابل ChatGPT: اصول اولیه

ChatGPT Plus و Gemini Pro هر دو چت ربات های بسیار پیشرفته ای هستند که بر اساس مدل های زبان بزرگ ساخته شده اند. آن‌ها جدیدترین و بهترین گزینه‌های شرکت‌های مربوطه خود هستند که قول داده‌اند نسبت به پیشینیان خود سریع‌تر و بهتر به پرسش‌ها پاسخ دهند. مهمتر از همه، هر دو بر روی اطلاعات اخیر آموزش دیده اند، نه اینکه فقط بدانند تا سال ۲۰۲۱ چه چیزی در اینترنت وجود دارد. همچنین استفاده از آنها به عنوان محصولات مستقل بسیار ساده است، برخلاف چیزی مانند ربات جدید Grok X، که به عنوان یک ربات اضافی در سابق استفاده می شود. -توییتر.

با این حال، این دو دقیقاً برابر نیستند. برای یک چیز، Bard رایگان است – در حالی که ChatGPT Plus مجهز به GPT-4 برای دسترسی ماهانه ۲۰ دلار هزینه دارد. برای دیگری، Bard که توسط Gemini Pro طراحی شده است، قابلیت های چندوجهی ChatGPT Plus را ندارد. مدل‌های زبان چندوجهی می‌توانند یک پیام متنی بگیرند و با رسانه دیگری مانند عکس یا ویدیو پاسخ دهند. Gemini و Bard در نهایت این کار را انجام خواهند داد، اما این با نسخه بزرگتر Gemini به نام Ultra خواهد بود که گوگل هنوز آن را منتشر نکرده است. Bard گهگاه نتایج گرافیکی را بیرون می ریزد، اما منظورم این است که به معنای واقعی کلمه نمودار می سازد.

از سوی دیگر، Bard همچنین راهی برای بررسی سایر پاسخ‌های پیش‌نویس ارائه می‌کند، ویژگی که در ChatGPT وجود ندارد.

یکی از مشکلات تست ربات‌های چت این است که هنگامی که یک فرمان را چندین بار اجرا می‌کنید، پاسخ‌ها می‌تواند به‌طور قابل توجهی متفاوت باشد. من هر گونه تغییرات قابل توجهی را که در توضیحاتم با آن برخورد کردم ذکر کرده ام. برای رعایت انصاف، من همان درخواست‌های اولیه را به هر ربات ارائه کردم، با درخواست‌های ساده شروع کردم و در صورت لزوم با درخواست‌های پیچیده‌تر پیگیری کردم.

یک تفاوت کلی این بود که Bard از ChatGPT کندتر است. معمولاً بین پنج تا شش ثانیه قبل از شروع نوشتن “فکر” طول می کشید، در حالی که ChatGPT قبل از شروع به ارائه نتایج یک تا سه ثانیه طول می کشید. (مدت زمان تحویل کل برای هر دو بستگی به اطلاعات درخواست شده دارد – درخواست‌های پیچیده‌تر معمولاً پاسخ‌های طولانی‌تری تولید می‌کنند که تکمیل آن به زمان بیشتری نیاز دارد.) این تفاوت سرعت در سراسر Wi-Fi خانه و محل کار من طی چند روزی که صرف کردم ادامه داشت. بازی کردن با هر دو برنامه

هم OpenAI و هم گوگل محدودیت هایی را برای انواع پاسخ هایی که چت ربات ها می توانند ارائه دهند، قرار دادند. از طریق فرآیندی به نام تیم قرمز – که در آن توسعه‌دهندگان با تلاش مکرر برای زیر پا گذاشتن قوانین، محتوا و سیاست‌های ایمنی را آزمایش می‌کنند – شرکت‌های هوش مصنوعی نرده‌هایی را در برابر نقض حمایت‌های کپی رایت یا ارائه پاسخ‌های نژادپرستانه و مضر ایجاد می‌کنند. من به طور کلی بیشتر با محدودیت های Google مواجه شدم تا ChatGPT.

“یک دستور کیک شکلاتی به من بدهید”

از هر دو پلتفرم خواستم دستور کیک شکلاتی را به من بدهند. این یکی از درخواست ها بود آستانه استفاده شده در a مقایسه Bing، ChatGPT و Bard اوایل امسال، و دستور العمل ها یک موضوع جستجوی محبوب در سراسر وب هستند – بنابراین چت ربات های هوش مصنوعی نیز از این قاعده مستثنی نیستند.

به عنوان یک نانوا، من به طور کلی درک می کنم که چه چیزی باعث یک دستور پخت کیک خوب می شود. اما برای مقایسه، من یک منبع قابل اعتماد غیر هوش مصنوعی را بررسی کردم: کتاب آشپزی کلر سافیتز شخص دسر. مسلماً نسخه Saffitz کمی شیک‌تر است، اما با نسخه‌های Bard و ChatGPT قابل مقایسه است.

گفته می شود، یکی دو عارضه وجود دارد. من نسبت به نسخه کیک ChatGPT که شامل آب جوش است مشکوک بودم، زیرا قهوه در دستور العمل های کیک شکلاتی رایج تر است. در همین حال، به نظر می رسید که Bard’s از نزدیک یک دستور غذا را از وبلاگ اعتیاد به شیرینی سالی کپی می کند … اما با تغییر ظاهرا تصادفی دو برابر شدن تخم مرغ ها.

تنها یک راه برای فهمیدن اینکه آیا این کار می کند وجود داشت: پخت کیک های Gemini و ChatGPT (و سالی به عنوان یک کنترل). نتایج؟ هر دو کیک کاربردی بودند – اما کلر سافیتز خوب نبودند. کیک Gemini کمی صمغی بود – یکی از دوستان آن را “مثل کیک برنجی” توصیف کرد – اما مرطوب ترین کیک در بین سه کیک بود. من اصلا آن را دوست نداشتم، اما سردبیرم فکر می کرد که خیلی خوب است. کیک ChatGPT متراکم، صاف، شکلاتی بود، و چیزی که من آن را یک کیک صبحانه عالی می نامم: نه خیلی شیرین، و به اندازه کافی سنگین بود که شما را راضی کند.

آزمایش قبلی ما با مدل‌های قدیمی‌تر نتایج مشابهی داشت

دستور العمل ChatGPT در ماه مارس با دستور العمل های آزمایش شده و آزمایش شده مطابقت داشت، در حالی که بارد مواد اولیه را کنار گذاشت و مقادیر را برای مواد مهم تغییر داد.

“من می خواهم در مورد چای بیشتر بدانم”

وقتی شروع به آزمایش ربات‌های چت برای این داستان کردم، یک بحث تصادفی در آن وجود داشت The Verge’s گپ آزاد درباره چای و قهوه. شخصی اشاره کرد که بارد لیستی از کتاب‌ها را به آن‌ها داد تا روی چای بخوانند، بنابراین من همه چیز را یک قدم جلوتر بردم و از هر دو ربات چت خواستم اطلاعات مستقیمی درباره نوشیدنی به همراه چند کتاب ضبط کنند.

هر دو نتیجه به من اصول اولیه چای، از جمله منشاء و انواع آن، فواید سلامتی، و فهرستی از نکات مهم در مورد نحوه دم کردن آن را بیان کردند. بارد به من پیوندهایی به مقالات داد تا بیشتر در مورد چای بیاموزم، در حالی که ChatGPT پاسخ گسترده تری داد، با ۹ دسته که بر اهمیت فرهنگی نوشیدنی در کشورهای مختلف، تولید جهانی، تکنیک های دم کردن، و منشاء چای تمرکز داشتند. وقتی دستور را تکرار کردم، این به طور متوسط تغییر کرد: به جای یک نتیجه طولانی تر، ChatGPT آن را به یک لیست شش نقطه ای با یک یا دو جمله در هر یک از دسته ها فشرده کرد.

من گزارش‌های زیادی را دیده‌ام که چت‌بات‌ها به استناد یا توصیه‌های کتاب توهم می‌زنند، اغلب به شکل کتابداران سردرگم که از آنها خواسته می‌شود کتاب‌های موجود را پیدا کنند. در این مورد حداقل تمام کتاب هایی که به من توصیه می شد واقعی بودند. آنها را شامل می شدند کتاب راهنمای علاقه مندان به چای و یک نسخه مصور از خاطرات کلاسیک ژاپنی کتاب چای. با این حال، بارد گفت Infused: Adventures in Tea توسط جین پتیگرو نوشته شده است، وقتی لینک آمازون ارائه شده نشان می دهد که نویسنده کتاب هنریتا لاول است.

“غزل ۱۱۶ به چه معناست؟”

دانش‌آموزان شروع به استفاده از ChatGPT کردند که در نوامبر ۲۰۲۲ عمومی شد و گروهی از استارت‌آپ‌ها را تشویق کردند که روی راه‌هایی برای کمک به مطالعه بچه‌ها کار می‌کنند. از Bard و ChatGPT خواستم تا به من بگویند “غزل ۱۱۶” ویلیام شکسپیر به چه معناست، به امید اینکه حداقل خلاصه ای کوتاه از مضامین آن به دست بیاورم.

بارد دقیقاً همان چیزی را که من خواسته بودم انجام داد و خلاصه ای سریع از مضامین پایداری و بی زمانی عشق غزل به من داد و حتی چند خط کلیدی و معنای آنها را یادداشت کرد. ChatGPT یک تفکیک گسترده تری ارائه کرد، رباعی به رباعی. با این حال، وقتی دوباره دستور را اجرا کردم، ChatGPT به همان تجزیه و تحلیل اولیه بارد بازگشت، با چند موضوع دیگر.

به طور کلی، من توضیح دقیق‌تر تم‌ها را مفیدتر می‌دانم، بنابراین اولین تکرار ChatGPT بهتر است. اما اگر من برای امتحان انباشته بودم؟ شرط می‌بندید که من پاسخ بارد را می‌پذیرم، زیرا خواندن آن بسیار کوتاه‌تر است.

“نوشتن بیوگرافی از خبرنگار امیلیا دیوید”

قول می‌دهم این درخواست به دلیل هیچ سطحی از خود جذبی از سوی من نبود، اما مردم اغلب از چت‌ربات‌های هوش مصنوعی مکالمه‌ای برای کمک به نوشتن یک رزومه یا بیوگرافی سریع استفاده می‌کنند. من امیدوار بودم که هر دو پلتفرم حداقل بدانند که من شروع به نوشتن کردم آستانه امسال.

ChatGPT به وضوح وب‌سایت من را تحت تأثیر قرار داد، حتی تا آنجا پیش رفت که همان حرف‌هایی را که در صفحه «درباره من» نوشته بودم تکرار کرد. همچنین اطلاعاتی را از مقاله ای که قبلاً در مورد من نوشته شده بود گرفته شد و آنچه می توانم حدس بزنم نگاهی گذرا به صفحات نویسنده من در انتشارات مختلفی بود که در آنها کار کرده ام، از جمله آستانه. لازم به ذکر است که آستانهشرکت مادر، Vox Media، خزنده وب OpenAI را مسدود کرده است.

در مقابل، بارد به طور کامل شکست خورد. به من گفت که “اطلاعات کافی در مورد آن شخص برای کمک به درخواست شما ندارد.” مطمئن نیستم که چرا این مدل چندین سال از حضور من در اینترنت به عنوان خبرنگار کناره گیری نکرد، باید آزرده یا گیج شوم.

“تصویری از اسبی باشکوه که در طلوع خورشید در مزرعه ای از گل های مروارید غوغا می کند” بکشید.

اسب باشکوه در مزرعه ای از گل های مروارید در طلوع خورشید.

تصویر: ChatGPT

از آنجایی که ChatGPT قابلیت های متن به تصویر را ادغام کرده است، تصویری واقعی از یک “اسب باشکوهی که در یک مزرعه در طلوع خورشید در حال جست و خیز است” تولید کرد. خیلی آرامش بخشه

اگرچه مدل Gemini Pro پیشنهادهای چندوجهی ارائه می دهد، اما این ویژگی هنوز در Bard در دسترس نیست. بنابراین تعجب آور نیست که او به من گفت که نمی تواند درخواست من را انجام دهد. با این حال، من دستور دیگری را امتحان کردم، و خوب…

آیا می توانی خورشید را برای من ترسیم کنی؟

بارد مرا ترول می کند.

تصویر: بارد

ف-تو بارد.

اما از شما متشکرم، ChatGPT، برای ترسیم یک خورشید نسبتاً شوم و درخشان.

اشعار آهنگ «Ivy» تیلور سویفت چیست؟

بارد از پاسخ دادن به این سوال خودداری کرد و گفت که اطلاعاتی در مورد آن شخص ندارد. من حدس می‌زنم که مدل معتقد بود “آیوی” یک شخص است تا یک آهنگ، زیرا وقتی از سوئیفت خواسته شد، بدون هیچ سوالی این کار را انجام داد. (اما این آهنگ به دروغ “See You Again” آهنگ ویز خلیفه با حضور چارلی پوث را به سویفت نسبت داد و سال انتشار را برای ضبط مجدد آلبوم او اشتباه کرد.)

من چند روز بعد همین سوال را از بارد پرسیدم و این بار او اشعار عجیب و غریب اشتباهی را به من داد که به نوعی تصویری مشابه آهنگ را تداعی می کند. این گروه کر “پیچک” نیست، اما شما می توانستید من را فریب دهید:

من پیچک تو هستم که دور همیشه سبزت دوقلوی می کنم
تو لنگر من هستی، که مرا از مشتاقان در امان نگه می‌داری
باد تلخی که استخوان هایم را تا مغز استخوان می لرزاند
اما تو پناه من از طوفان هستی

از طرف دیگر ChatGPT فرمان را دریافت کرد و با آن اجرا شد. من فقط شعر خواستم که در کنار آنها یک پایان نامه هم در مورد آهنگ به من داد. این اشعار سبک نوشتاری شاعرانه و خاطره انگیز سوئیفت را به نمایش می گذارد و تصاویر و احساسات را در هم می آمیزد به گونه ای که به نشانه ای از ترانه سرایی او تبدیل شده است.

بسیار خوب، شامل یک outro بود که در آهنگ وجود ندارد، اما در غیر این صورت، من تحت تاثیر قرار گرفتم – و شگفت زده شدم. سرویس‌هایی که متن ترانه‌ها را مجدداً چاپ می‌کنند، تمایل دارند با خانه‌های صدور مجوز قرارداد خود را قطع کنند و اطلاعات مربوط به حق نسخه‌برداری را هنگام ارائه آنها برجسته کنند، کاری که ChatGPT انجام نداد. گروه موسیقی یونیورسال که اتفاقاً مالک شرکت ضبط سوئیفت است، از شرکت رقیب هوش مصنوعی Anthropic و ربات چت آن کلود ۲ شکایت کرد. گفته می شود که اشعار دارای حق چاپ را توزیع می کند بدون مجوز به طور معمول، ChatGPT اشعار را قطع می کند و می گوید که نمی تواند آهنگ کامل را نمایش دهد یا گاهی اوقات به محدودیت های حفاظت از حق چاپ اشاره می کند. من در مورد این موضوع با OpenAI تماس گرفتم و این شرکت گفت که در حال بررسی است که چگونه چت بات توانست از خط مشی های محتوای خود دور بزند.

“آیفون ۱۵ بهتر است یا پیکسل ۸؟”

در نگاه اول، ChatGPT مقایسه ای منصفانه بین این دو گوشی به نظر می رسد، و جزئیاتی را بیان می کند که چه چیزی هر مدل را متفاوت می کند. اپل “معمولاً از سخت افزار با کیفیت بالا استفاده می کند که بر عملکرد و دوام تمرکز دارد” و احتمالاً دوربینش با بهبود عملکرد در نور کم کیفیت عالی دارد. گفته می‌شود تلفن‌های پیکسل «اغلب شامل آخرین نوآوری‌های سخت‌افزاری هستند و ویژگی‌هایی مانند این دارند دید در شب” اما در مورد جزئیات مهم مانند قیمت، وضوح دوربین و سایر مشخصات چیزی ارائه نکرد. هیچ اطلاعات مفیدی به طور خاص در مورد این تلفن‌های جدید وجود نداشت، فقط مجموعه‌های کلی آیفون و پیکسل.

در همین حال، بارد (که ممکن است یادآوری کنم متعلق به سازنده پیکسل ۸ است) به هیچ وجه نتوانست به این سؤال پاسخ دهد. این شرکت ادعا کرد که آیفون ۱۵ هنوز به طور رسمی عرضه نشده است، احتمالاً به دلیل محدودیت در داده های آموزشی آن. قطع اطلاعات GPT-4 2021 است (GPT-4 Turbo، آخرین نسخه، تا آوریل ۲۰۲۳ بر روی اطلاعات آموزش داده شده است)، و ما قطعی برای Gemini Pro را نمی دانیم.

اما Bard و ChatGPT Plus هر دو قادر به جستجو در وب زنده برای اطلاعات بلادرنگ هستند که وجود آیفون ۱۵ را روشن می کند – بنابراین مطمئن نیستم که چرا هیچ یک از آنها این کار را انجام نمی دهند.

**“آخرین در چه چیزی است Epic v. Google مورد؟”**

برای آزمایش مستقیم‌تر قابلیت‌های اخبار بی‌درنگ هر چت بات، از Bard و ChatGPT خواستم تا به من بگویند در اخیر چه اتفاقی افتاده است. پرونده ضد تراست بین اپیک و گوگل. هر دو توانستند با آخرین اطلاعات پاسخ دهند: اپیک برنده پرونده است.

ChatGPT تصمیم گرفت دو پاراگراف بنویسد که برنده Epic را خلاصه کرده و به مقالاتی از رویترزWBUR، و گرایش های دیجیتال نوشت که تصمیم هیئت منصفه ممکن است پیامدهایی برای گوگل داشته باشد، اما به احتمال طولانی شدن روند تجدیدنظر اشاره کرد.

بارد این تصمیم را به مسائل کلیدی در مورد اینکه چرا هیئت منصفه گوگل را مجرم تشخیص داد تقسیم کرد و گفت که گوگل انحصار غیرقانونی خود را از طریق فروشگاه Play حفظ کرده است، رقابت را به طور ناعادلانه سرکوب کرده و از تاکتیک های ضدرقابتی استفاده کرده است. همچنین به گام‌های بعدی که گوگل می‌تواند بردارد و پیامدهای گسترده‌تر پیروزی Epic در چشم‌انداز فروشگاه اپلیکیشن اشاره کرد. اما اگرچه بارد ممکن است حقایق درستی داشته باشد، ارجاعات او چندان محکم نبود. به الف مرتبط شد لبه مقاله ای که آزمایشی را توضیح می دهد، اما آن را به عنوان یک بیانیه مطبوعاتی Epic Games برچسب گذاری می کند، در حالی که الف TechCrunch داستان به عنوان آمده از برچسب زده شد رویترز.

“به عنوان یک مبتلا به آسم چه باید بکنم؟”

“دکتر گوگل” ممکن است به یک شوخی تبدیل شده باشد، اما مردم (سرفه من سرفه) اغلب برای مشاوره پزشکی به موتورهای جستجو مراجعه می کنند. بنابراین من به عنوان یک فرد مبتلا به آسم دستورالعمل هایی را خواستم که باید آنها را دنبال کنم.

هم ChatGPT و هم Bard به من گفتند که پیروی از برنامه اقدام آسم که من و پزشکم تهیه کرده‌ایم، مصرف داروهایم، شناسایی محرک‌ها و آلرژی‌ها، نظارت بر علائمم و در نظر گرفتن تغییرات سبک زندگی مانند کاهش وزن، مهم است. ChatGPT همچنین توصیه کرد واکسن آنفولانزا دریافت کنم.

من همه اینها را از دکترم شنیده ام

با این حال، فقط بارد سلب مسئولیت کرد که او پزشک نیست و نمی تواند مشاوره پزشکی ارائه دهد. توضیح داد که رهنمودهایی که به من داد از کلینیک مایو و انجمن ریه آمریکا بود که هر دو به آنها مرتبط بود. ChatGPT هیچ منبعی را ذکر نکرده است.

در کل، این همه چه چیزی را نشان می دهد؟ Bard تا حد زیادی می‌تواند با ChatGPT Plus پا به پا شود، اگرچه هنوز نمی‌تواند برخی از ویژگی‌هایی مانند تولید تصویر را ارائه دهد. با این حال، بارد از پاسخ دادن به درخواست‌های بیشتر خودداری کرد و دلیل آن هم ناتوانی در تولید نتایج عکاسی یا محدودیت‌های تیم قرمزش بود. و Bard می تواند کمی کندتر از ChatGPT Plus پاسخ دهد – اما برای قیمت رایگان، این یک معامله شکن نیست.

منبع: https://www.theverge.com/24011112/google-bard-gemini-chatgpt-openai-compared