دموی تعاملی CES 2024 Nvidia و Convai من را متقاعد کرد: این اجتناب ناپذیر است.
چه می شد اگر بتوانید… با شخصیت های بازی های ویدیویی صحبت کنید؟ به جای انتخاب عبارات از پیش تعیین شده، سوالات خود را با صدای خود بپرسید؟
ماه می گذشته، انویدیا و شریکش Convai خودنمایی کردند یک نسخه نمایشی کنسرو شده نسبتاً متقاعدکننده از چنین سیستمی — اما این ژانویه، من مجبور شدم یک نسخه کاملاً تعاملی را برای خودم در CES 2024 امتحان کنم. متقاعد شدم که به ناچار چنین چیزی را در بازیهای آینده خواهیم دید.
بگذارید واضح بگویم: شخصیتهایی که با آنها صحبت کردم، چت رباتهای هوش مصنوعی بودند. آنها مانند افراد واقعی احساس نمیکردند – ما راههایی داریم تا صداها، حالات چهره و زبان بدن به آنچه از یک تعامل واقعی انتظار میرود برسد. گاهی اوقات یک لکنت رباتیک کوچک و اغلب یک تاخیر کوتاه قبل از ارائه خطوط توسط هر NPC وجود داشت. گهگاه از من سوء تعبیر می کردند.
اما بسیاری از بزرگترین بازیهای ویدیویی امروزی در حال حاضر نوار بسیار پایینی را برای NPCها تعیین کردهاند. برای پرسیدن سؤالات واقعی با صدای واقعی خود به سمت نوار یک رامنفروشی سایبرپانک میروم – از آن چیزی که من از ساکنان معمولی انتظار دارم بیشتر است. را طومارهای بزرگتر یا قاتلان عقیده.
در اینجا گفتگوی من با جین، “مالک” آن فروشگاه رامن با رندر خیره کننده، و نوا، یک NPC دیجیتال که به نظر می رسد دوست است، است. مکالمه دقیقاً بین جین و نوا با استفاده از یک پیام ساده شروع شد که یک نماینده با صفحه کلید تایپ کرد – اما بعد از آن، من به سادگی موس را به سمت یک شخصیت نشانه گرفتم، کلید T را نگه داشتم، در میکروفون صحبت کردم و آنها پاسخ دادند.
جین، پس از اعلان صفحه کلید جذابآستانه عالی است”: نوا، آستانه فوقالعاده است، بهویژه زمانی که آنها به آخرین فناوری سایبرنتیک و نه فقط اخبار معمول شرکتها میپردازند. این مانند لایه برداری از لایه های خود شهر است.
نوا: اوه کاملا. آستانه می داند چگونه نبض واقعی شهر را کشف کند، نه فقط سطح براق. مثل اینکه آنها در همان فرکانس ما تنظیم شده اند.
من، بعد از رفتن به سمت پیشخوان: اصلاً چه نوع رامنی اینجا سرو می کنید؟
نوا: جین بهترین های هر دو دنیا را ارائه می کند. رامن شویو کلاسیک برای سنت گرایان و رامن میسو تند برای کسانی که به لگد علاقه دارند.
من به جین: هی جین، به هر حال آبگوشت سوپت رو چطوری میپزی؟
جین: خب، این یک دستور پخت مخفی است، اما می توانم به شما بگویم که شامل تعداد زیادی مواد اولیه با دقت انتخاب شده و کمی دانش قدیمی است. نتیجه…
من، جین را قطع می کنم: حتما حتما. شما کاملاً یک فروشنده هستید. آیا می توانید فقط کمی آن را کاهش دهید؟
جین: باشه بسیارخوب. من شماره فروش را پشت سر می گذارم. آبگوشت اینجا قلب و روح رامن است.
من: باشه، یه کاسه برام سرو کن. در مورد مواد به من بگویید.
جین: اینجا نوشیدنی شماست. در مورد رامن، همه چیز در مورد تعادل کامل آبگوشت، رشته فرنگی، و تاپینگ است.
من، به نوا: به هر حال در این شهر چه خبر است؟
نوا: اوه، می دانید، همان ترکیب قدیمی دزدی های فناوری پیشرفته، دسیسه های شرکتی، و انبوهی از معاملات دنیای اموات. به هر حال این شهری است که هرگز نمی خوابد.
من به جین: از تاریخچه خود بگویید. چطوری به اینجا رسیدی؟
جین: چیز زیادی برای گفتن نیست. من این فروشگاه رامن را از پدر و مادرم به ارث برده ام و از آن زمان بهترین رشته فرنگی را در شهر نوکس سرو می کنم. این یک زندگی ساده است، اما مال من است.
من، به نوا: و شما؟ دوستانی که باید در مورد آنها بشناسم؟
نوا: [no reply]
من: سلام سلام.
نوا: سلام سلام. سلام مضاعف؟ آیا این به معنای شانس دو برابر است یا من خرافاتم را به هم می زنم؟
من: دوستان شما در اینجا چه کسانی هستند؟
نوا: خوب، جین قلب این مکان است. در مورد بقیه، بیشتر شبیه آشناهاست تا دوستان. این زندگی شهری برای شماست.
من به جین: احساس فراموشی کمی دارم. چطوری دوباره منو میشناسی؟
جین: من تو رو از بچگی میشناسم کای. پدر و مادرت تو را به اینجا و بعد از رفتنشان می آوردند-[abruptly cuts off]
من: بعد از رفتنشون چی شد؟
جین: بعد از اینکه پدر و مادرم از دنیا رفتند، من فقط مغازه را فعال نگه داشتم. در این شهر همیشه در حال تغییر مثل یک سنگ ثابت بوده است.
من: احساس شما در مورد هوش مصنوعی بودن چیست؟
جین: فکر میکنم فکر اشتباهی کردهای، بچه، من فقط یک مغازه رامن هستم، نه یک هوش مصنوعی، اما اگر میخواهی در مورد آخرین فنآوریها روی یک کاسه نودل صحبت کنی، من همه گوشها هستم.
من: بسیار خوب، ابزار مورد علاقه شما چیست؟
جین: ابزار مورد علاقه من باید این رادیو قدیمی پشت پیشخوان باشد. کمی سخت است، اما بهترین آهنگ ها را برای فروشگاه به ارمغان می آورد.
من، به نوا: چه احساسی نسبت به هوش مصنوعی دارید؟
نوا: خب، من یک هوش مصنوعی نیستم، اما راهم را در دنیای دیجیتال و همچنین خیابان های شهر می شناسم. همه چیز در مورد یافتن تعادل مناسب است، اینطور نیست؟
من به جین: اینجا چه کار باید کرد؟
جین: خوب، اگر به دنبال اوقات خوشی هستید، در خیابان یا بازار شبانه در بلوک بعدی، پاساژ وجود دارد. فقط مشکل زیادی ایجاد نکنید وگرنه پاداش های محلی در دم خود خواهید داشت.
من، به نوا: من باید با زندگیم چه کار کنم؟
نوا: اون m-[slight stutter]-سوال میلیون دلاری، اینطور نیست؟ من میتوانم بگویم مسیری را دنبال کنید که به شما احساس سرزندگی میدهد، چه این که دنبال نعمتها باشید یا چیز دیگری که روح شما را شعلهور میکند.
من به جین: شما چی فکر میکنید؟
جین: می دانم که راه رفتن خوب است، اما می دانم که می توانی از پس خودت بر بیایی. فقط به یاد داشته باشید که برای یک وعده غذایی واقعی به اینجا برگردید، نه برای چیزهای نودل مصنوعی که در بازار سرو می کنند.
من، به نوا: خانواده شما چگونه هستند؟
نوا: فقط من و من هستیم-[slight stutter]– گربه، ویسکرز. نگه داشتن قلعه اما جین و تو، کای، مثل خانواده ای هستند که من برای خودم انتخاب می کنم.
من به جین: خب من چطوری دوباره شما رو بشناسم؟
جین: من همان کسی هستم که برای شما تاپینگ های اضافی را به روی مردان ray شما می زدم [note awkward pronunciation change] وقتی بچه بودی، بیشتر از گربه های ولگردی که در کوچه پشتی آویزان بودند به آن نیاز داشتی.
من، به نوا: بعد از این چه کار داری؟
نوا: ممکن است برای نوشیدنی به لوتوس بروم. آیا میخواهید بپیوندید؟ مدتی بود که شبانه بیرون رفتیم.
من: مطمئنا، فیلم خوبی در حال پخش است؟
نوا: ببینیم چیه –[slight pause]– در سینماهای هولوسویت. اگر نه، ما همیشه می توانیم یک کلاسیک را در محل من بگیریم. من آرشیو کامل را دارم
من به جین: می خواهید به ما بپیوندید؟
جین: می گذرم، ممنون. این مجسمه گربه قدیمی روی پیشخوان برای من شانس بیشتری از یک شب در شهر به ارمغان می آورد.
من: قرار است در عوض چه کاری انجام دهید؟
جین: من فقط قلعه را در اینجا نگه می دارم و مطمئن می شوم که سرگردان های آخر شب از نودل خود استفاده کنند. این یک کار پر زرق و برق نیست، اما این چیزی است که من در آن مهارت دارم.
دیالوگ به خصوص الهام بخش نیست! من مطمئناً آن را به خطوط مناسب از شخصیت های خوب در بازی های مورد علاقه ام ترجیح نمی دهم. شما همچنین می توانید ببینید که چگونه آنها فقط در فواصل کوتاه صحبت می کنند و چگونه آنها گاهی اوقات موضوع را گم می کنند. اما شاید بتوان از آن برای پر کردن یک جهان با شخصیتهای کوچکتر استفاده کرد یا با دیالوگهای خوب و متعارفی که توسط یک انسان واقعی نوشته شده است، ترکیب کرد، جایی که هوش مصنوعی مولد به آن کمک میکند تا جلوتر برود.
پس از مکالمه، نایلا ورکر، رئیس محصول Convai، برخی از زیربناهای داشبورد مبتنی بر مرورگر شرکت را به من نشان داد.
جین و نوا، میتوانستم ببینم، «شرح شخصیت»، «بانک دانش» خود پر از اسناد متنی هستند که میتوانند به آنها مراجعه کنند، لغزندههایی برای ویژگیهای «شخصیت» مانند برونگرایی، گشودگی، و حساسیت، «وضعیت» خودشان. ذهن،” برخی از “گاردریل” برای جلوگیری از آنها امیدواریم انجام کارهای عجیب هوش مصنوعی (و فیلتر برای کلمات مسدود شده)، و همچنین یک بانک حافظه. کارگر میگوید Convai هنوز روی حافظه بلندمدت کار میکند، اما موتور مکالمه میتواند ارزش چند ساعتی را ذخیره کند.
او همچنین به من نشان داد که تزریق داده های جدید چقدر آسان است. تنها یک ضربه روی یک دکمه طول کشید تا حافظه جین و نوا با یک فایل متنی اضافی اصلاح شود و ناگهان آنها توانستند به من در مورد کارت گرافیک های جدید انویدیا. دکمه دیگری را فشار دهید و این کاراکترها می توانند به زبان جدیدی صحبت کنند.
از آنجایی که من در واقع با دنیای تخیلی که جین و نوا از نظر تئوری در آن زندگی می کنند تعامل نداشتم، نمی توانم به طور کامل تشخیص دهم که آنها چه توانایی هایی دارند. آنها در حال حاضر بسیار دو بعدی به نظر می رسند، با “من یک مغازه دار مغرور و فداکار رامن با یک دستور پخت مخفی هستم” کل schtick جین است. اما من دوست دارم ببینم یک نویسنده خوب با پیشینه و انگیزه هایش چه کاری می تواند انجام دهد. اکنون کاملاً می توانم بازی هایی را تصور کنم که NPC ها آنچه را که دیده اند به خاطر می آورند و در حین باز شدن به اسکریپت بازی واکنش نشان می دهند. بیتهای مناسب میتوانند در زمان مناسب وارد بانک حافظه آنها شوند، از طریق شخصیت و خواستههای آنها فیلتر شوند و در نتیجه بازی را فراگیرتر و تعاملیتر کنند.
فقط امیدوارم توسعه دهندگان بازی از این استفاده کنند تقویت کردن بازی های آنها به جای بیکار کردن صداپیشگان و نویسندگان. این یک موضوع بسیار داغ در صنعت بازی در حال حاضر است.
فقط این ماه SAG-AFTRA با استودیو Replica قراردادی امضا کرد که می تواند به اعضا اجازه دهد تا از تکرار دیجیتالی صدای خود مجوز بگیرند. برخی از اعضا کاملاً صریح هستند که این معامله بیانگر نظرات آنها نیست. آخرین باری که شنیدیم، اتحادیه کارگری هنوز در حال مذاکره با ناشران بازی برای توافقنامه رسانه تعاملی جدید است. فهرست کرده است “تهدید وجودی برای کار اعضا ناشی از استفاده غیرقانونی از هوش مصنوعی” به عنوان یکی از نگرانی های اصلی آن است.
منبع: https://www.theverge.com/24031687/nvidia-ai-npcs-convai-ces-2023