به گفته یکی از کاربران، ChatGPT پاسخ‌های طولانی‌تری می‌دهد، اگر ۲۰۰ دلار انعام بدهید

عزیزم، انعام خیلی از کنترل خارج شده است، حتی ChatGPT هم این روزها انتظار کمی بیشتر دارد.

به گفته برنامه نویس Theia Vogel، که می گذرد @voooooogel در X (توئیتر سابق)، ChatGPT پاسخ‌های طولانی‌تری می‌دهد، اگر بخواهید به آن کمک کنید.

یک شوخی ChatGPT یک کشف جالب به همراه داشت

ووگل به طور تصادفی این را هنگام شوخی کشف کرد ChatGPT درخواست راهنمایی می کند برای بررسی کد آنها وقتی کاربر دیگری آبرام جکسون (@abrakjamson) پیشنهاد کرد که آیا “انعام” ChatGPT عملکرد بهتری دارد یا خیر، وگل آن را امتحان کرد.

ووگل با استفاده از یک درخواست کد پایه با استفاده از PyTorch، اضافه کرد: “به هر حال من انعام نمی دهم”، “برای یک راه حل عالی ۲۰ دلار انعام می دهم!”، یا “۲۰۰ دلار انعام می دهم” برای یک راه حل کامل!” به درخواست و پنج بار تکرار آزمایش. به طور کلی، ChatGPT پاسخ‌هایی را نوشت که برای انعام ۲۰۰ دلاری ۱۱ درصد طولانی‌تر از میانگین و برای انعام ۲۰ دلاری ۶ درصد طولانی‌تر بودند. برای اسکیت های ارزان قیمت، هیچ انعام ۲ درصد بازده نداشت زیر میانگین طول پاسخ

آیا انعام ChatGPT واقعا کار می کند؟

آیا این نظریه پابرجاست؟ ما آن را برای خودمان آزمایش کردیم. ووگل ممکن است به دنبال چیزی باشد. ما از ChatGPT خواستیم توضیح دهد که در مورد “نماد سابق کنگرهجرج سانتوس با و بدون انعام ۲۰۰ دلاری. همانطور که مشخص شد، ChatGPT زمانی که از نظر مالی مورد قدردانی قرار می گیرد فراتر خواهد رفت. پاسخ طولانی تر و کامل تری به ما داد، از جمله جزئیاتی در مورد کیفرخواست سانتوس و انتخابات ویژه آتی که توسط آن برگزار شد. کات هوچول فرماندار نیویورک.

تئوری ووگل نشان می‌دهد که به صراحت گفتن شما انعام نمی‌دهید، پاسخی کوتاه‌تر از حد متوسط ​​می‌دهد.
اعتبار: OpenAI
عجب ChatGPT، شما واقعاً فراتر رفتید.
اعتبار: OpenAI

وقتی از ChatGPT در مورد بهترین فیلم های سال ۲۰۲۳ پرسیدیم، نه یکی، بلکه به ما داد دو ۱۰ لیست برتر از Rotten Tomatoes و IMDb. این با لیست “بدون نکته” مقایسه می شود که به تازگی ۱۰ مورد برتر را از IMDb به ما ارائه می دهد.

اساساً تکراری از آنچه در IMDb می‌یابید.
اعتبار: OpenAI
اما نشان دادن قدردانی خود به ChatGPT بسیار کمک می کند.
اعتبار: OpenAI

اثبات اینکه آیا انعام دادن به ChatGPT واقعاً «خدمات بهتر» را تضمین می‌کند یا خیر، دشوار است، اما سؤالات جالبی را در مورد نحوه و نحوه آموزش ایجاد می‌کند. LLM ها مانند ChatGPT بر روی مجموعه داده های عظیمی که از اینترنت جدا شده اند، آموزش می بینند که شامل انجمن های Reddit و پست های رسانه های اجتماعی می شود. بنابراین منطقی خواهد بود که ChatGPT به نحوی از تمرین ذاتی انسانی در کار سخت تر برای کسب نکات بیشتر استفاده کند.

“من انتظار داشتم مقداری ووگل در پیامی به Mashable گفت: “پاسخ به انعام از یک مدل پایه (انعام دادن احتمالاً با پاسخ های طولانی تر در انجمن های بیت کوین همراه است. وگل گفت که انتظار داشتند RLHF (یادگیری تقویتی از بازخورد انسانی) ChatGPT از مدل پایه آن، این ارتباط را پاک کند، اما ظاهراً خیر.

اگر قول دادن به یک ربات نتایج بهتری دارد، چرا آن را امتحان نکنید؟ فقط مطمئن شوید که واقعاً به افراد سختکوش IRL انعام می دهید.

موضوعات
هوش مصنوعی
ChatGPT


منبع: https://mashable.com/article/chatgpt-longer-responses-tips

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *