آن ویدیوی Google Gemini به دلیل برخی ویرایش‌های ظریف بسیار شگفت‌انگیز بود

یک ویدیوی نمایشی از Gemini، مدل جدید هوش مصنوعی گوگل، آنقدر که به نظر می‌رسد «ذهن‌افکن» نیست.

روز چهارشنبه گوگل منتشر شد جوزا، یک مدل چندوجهی بومی ساخته شده که در معیارهای اصلی اطلاعاتی از GPT-4 OpenAI پیشی گرفته است. یک ویدیوی نمایشی شش دقیقه‌ای که توانایی‌های شگفت‌انگیز Gemini را برای ردیابی توپ در فنجان، تعیین مکان کشورها بر روی نقشه و شناسایی یک نقاشی ساده اردک نشان می‌دهد. وای فناوران در رسانه های اجتماعی – و به نظر می رسید اینترنت را متقاعد می کند که AGI (هوش عمومی مصنوعی) در افق است.

اما طولی نکشید که کارشناسان دریافتند ویدیوی Gemini کمی اغراق آمیز است. مانند پارمی اولسون برای بلومبرگ برای اولین بار گزارش شد، ویدئو به روش های متعددی ویرایش شد.

گوگل چگونه دموی Gemini را زیبا کرد؟

همانطور که توسط گوگل تایید شده است، این ویدئو در زمان واقعی ضبط نشده است. به گفته سخنگوی گوگل، در عوض، این ویدئو با استفاده از فریم‌های تصویر ثابت از فیلم و درخواست از طریق متن ایجاد شده است.

به نظر می رسد که Gemini توسط صدای شخص تحریک می شود، اما صدا در واقع بعدا اضافه شده است. با این حال، نماینده گوگل گفت: “کاربر گزیده های واقعی از دستورات واقعی مورد استفاده برای تولید خروجی Gemini را که در ادامه می آید، صدا می کند.” علاوه بر این، با توجه به توضیحات در یوتیوب، “تأخیر کاهش یافته است و خروجی های Gemini برای اختصار کوتاه شده است.” به عبارت دیگر زمان پاسخگویی سریع آن در ویدیو واقعی نیست.

پس از اینکه مشخص شد قابلیت‌های Gemini با ویرایش ساده ویدیو افزایش یافته است، اوریول وینیالز، معاون آموزشی و پژوهشی Google DeepMind ارسال شده در X (توئیتر سابق) برای روشن شدن همه چیز. Vinyals گفت: “تمام پیام‌ها و خروجی‌های کاربر در ویدیو واقعی هستند و برای اختصار کوتاه شده‌اند.” این ویدئو نشان می‌دهد که تجربه‌های کاربری چندوجهی ساخته شده با Gemini چگونه می‌تواند باشد. ما آن را برای الهام بخشیدن به توسعه‌دهندگان ساخته‌ایم.

اما کاربران همچنان احساس می کردند فریب خورده اند. “اگر می‌خواهید الهام‌بخش توسعه‌دهندگان باشید، پس چرا محتوای واقعی را پست نمی‌کنید؟ درخواست‌ها نمی‌توانند “واقعی” و در عین حال کوتاه شوند. این نابخردانه و گمراه‌کننده بود.” یک کاربر در پست Vinyals “با عرض پوزش، “واقعی اما کوتاه شده” چیزی نیست.” دیگری گفت.

واکنش شدید به نسخه نمایشی برخی از دستاوردهای واقعی Gemini را تحت الشعاع قرار داد. پست وبلاگی که نحوه ساخت ویدیو را توضیح می‌دهد، مهارت‌های استدلالی چشمگیر Gemini را نشان می‌دهد، حتی اگر فقط از طریق پیام‌های متنی و عکس‌های ثابت (برخلاف صدا و ویدیو) باشد. سایر ویدیوهای تبلیغاتی موارد استفاده خاص را نشان می‌دهند که Gemini چگونه می‌تواند استخراج داده های علمی از ۲۰۰۰۰۰ مقاله تحقیقاتی یا کمک به والدین به فرزندانشان تکالیف ریاضی و فیزیک.

با این اوصاف، اینکه توانایی‌های Gemini بالاتر از حد انتظار باشد یا پایین‌تر، به تصمیم کاربران بستگی دارد.

موضوعات
هوش مصنوعی
گوگل


منبع: https://mashable.com/article/google-gemini-demo-video-editing

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *