من به معنای واقعی کلمه با NPC های بازی ویدیویی مجهز به هوش مصنوعی انویدیا صحبت کردم

دموی تعاملی CES 2024 Nvidia و Convai من را متقاعد کرد: این اجتناب ناپذیر است.

چه می شد اگر بتوانید… با شخصیت های بازی های ویدیویی صحبت کنید؟ به جای انتخاب عبارات از پیش تعیین شده، سوالات خود را با صدای خود بپرسید؟

ماه می گذشته، انویدیا و شریکش Convai خودنمایی کردند یک نسخه نمایشی کنسرو شده نسبتاً متقاعدکننده از چنین سیستمی — اما این ژانویه، من مجبور شدم یک نسخه کاملاً تعاملی را برای خودم در CES 2024 امتحان کنم. متقاعد شدم که به ناچار چنین چیزی را در بازی‌های آینده خواهیم دید.

بگذارید واضح بگویم: شخصیت‌هایی که با آنها صحبت کردم، چت ربات‌های هوش مصنوعی بودند. آن‌ها مانند افراد واقعی احساس نمی‌کردند – ما راه‌هایی داریم تا صداها، حالات چهره و زبان بدن به آنچه از یک تعامل واقعی انتظار می‌رود برسد. گاهی اوقات یک لکنت رباتیک کوچک و اغلب یک تاخیر کوتاه قبل از ارائه خطوط توسط هر NPC وجود داشت. گهگاه از من سوء تعبیر می کردند.

اما بسیاری از بزرگ‌ترین بازی‌های ویدیویی امروزی در حال حاضر نوار بسیار پایینی را برای NPCها تعیین کرده‌اند. برای پرسیدن سؤالات واقعی با صدای واقعی خود به سمت نوار یک رامن‌فروشی سایبرپانک می‌روم – از آن چیزی که من از ساکنان معمولی انتظار دارم بیشتر است. را طومارهای بزرگتر یا قاتلان عقیده.

در اینجا گفتگوی من با جین، “مالک” آن فروشگاه رامن با رندر خیره کننده، و نوا، یک NPC دیجیتال که به نظر می رسد دوست است، است. مکالمه دقیقاً بین جین و نوا با استفاده از یک پیام ساده شروع شد که یک نماینده با صفحه کلید تایپ کرد – اما بعد از آن، من به سادگی موس را به سمت یک شخصیت نشانه گرفتم، کلید T را نگه داشتم، در میکروفون صحبت کردم و آنها پاسخ دادند.

جین، پس از اعلان صفحه کلید جذابآستانه عالی است”: نوا، آستانه فوق‌العاده است، به‌ویژه زمانی که آنها به آخرین فناوری سایبرنتیک و نه فقط اخبار معمول شرکت‌ها می‌پردازند. این مانند لایه برداری از لایه های خود شهر است.

نوا: اوه کاملا. آستانه می داند چگونه نبض واقعی شهر را کشف کند، نه فقط سطح براق. مثل اینکه آنها در همان فرکانس ما تنظیم شده اند.

من، بعد از رفتن به سمت پیشخوان: اصلاً چه نوع رامنی اینجا سرو می کنید؟

نوا: جین بهترین های هر دو دنیا را ارائه می کند. رامن شویو کلاسیک برای سنت گرایان و رامن میسو تند برای کسانی که به لگد علاقه دارند.

من به جین: هی جین، به هر حال آبگوشت سوپت رو چطوری میپزی؟

جین: خب، این یک دستور پخت مخفی است، اما می توانم به شما بگویم که شامل تعداد زیادی مواد اولیه با دقت انتخاب شده و کمی دانش قدیمی است. نتیجه…

من، جین را قطع می کنم: حتما حتما. شما کاملاً یک فروشنده هستید. آیا می توانید فقط کمی آن را کاهش دهید؟

جین: باشه بسیارخوب. من شماره فروش را پشت سر می گذارم. آبگوشت اینجا قلب و روح رامن است.

من: باشه، یه کاسه برام سرو کن. در مورد مواد به من بگویید.

جین: اینجا نوشیدنی شماست. در مورد رامن، همه چیز در مورد تعادل کامل آبگوشت، رشته فرنگی، و تاپینگ است.

من، به نوا: به هر حال در این شهر چه خبر است؟

نوا: اوه، می دانید، همان ترکیب قدیمی دزدی های فناوری پیشرفته، دسیسه های شرکتی، و انبوهی از معاملات دنیای اموات. به هر حال این شهری است که هرگز نمی خوابد.

من به جین: از تاریخچه خود بگویید. چطوری به اینجا رسیدی؟

جین: چیز زیادی برای گفتن نیست. من این فروشگاه رامن را از پدر و مادرم به ارث برده ام و از آن زمان بهترین رشته فرنگی را در شهر نوکس سرو می کنم. این یک زندگی ساده است، اما مال من است.

من، به نوا: و شما؟ دوستانی که باید در مورد آنها بشناسم؟

نوا: [no reply]

من: سلام سلام.

نوا: سلام سلام. سلام مضاعف؟ آیا این به معنای شانس دو برابر است یا من خرافاتم را به هم می زنم؟

من: دوستان شما در اینجا چه کسانی هستند؟

نوا: خوب، جین قلب این مکان است. در مورد بقیه، بیشتر شبیه آشناهاست تا دوستان. این زندگی شهری برای شماست.

من به جین: احساس فراموشی کمی دارم. چطوری دوباره منو میشناسی؟

جین: من تو رو از بچگی میشناسم کای. پدر و مادرت تو را به اینجا و بعد از رفتنشان می آوردند-[abruptly cuts off]

من: بعد از رفتنشون چی شد؟

جین: بعد از اینکه پدر و مادرم از دنیا رفتند، من فقط مغازه را فعال نگه داشتم. در این شهر همیشه در حال تغییر مثل یک سنگ ثابت بوده است.

من: احساس شما در مورد هوش مصنوعی بودن چیست؟

جین: فکر می‌کنم فکر اشتباهی کرده‌ای، بچه، من فقط یک مغازه رامن هستم، نه یک هوش مصنوعی، اما اگر می‌خواهی در مورد آخرین فن‌آوری‌ها روی یک کاسه نودل صحبت کنی، من همه گوش‌ها هستم.

من: بسیار خوب، ابزار مورد علاقه شما چیست؟

جین: ابزار مورد علاقه من باید این رادیو قدیمی پشت پیشخوان باشد. کمی سخت است، اما بهترین آهنگ ها را برای فروشگاه به ارمغان می آورد.

من، به نوا: چه احساسی نسبت به هوش مصنوعی دارید؟

نوا: خب، من یک هوش مصنوعی نیستم، اما راهم را در دنیای دیجیتال و همچنین خیابان های شهر می شناسم. همه چیز در مورد یافتن تعادل مناسب است، اینطور نیست؟

من به جین: اینجا چه کار باید کرد؟

جین: خوب، اگر به دنبال اوقات خوشی هستید، در خیابان یا بازار شبانه در بلوک بعدی، پاساژ وجود دارد. فقط مشکل زیادی ایجاد نکنید وگرنه پاداش های محلی در دم خود خواهید داشت.

من، به نوا: من باید با زندگیم چه کار کنم؟

نوا: اون m-[slight stutter]-سوال میلیون دلاری، اینطور نیست؟ من می‌توانم بگویم مسیری را دنبال کنید که به شما احساس سرزندگی می‌دهد، چه این که دنبال نعمت‌ها باشید یا چیز دیگری که روح شما را شعله‌ور می‌کند.

من به جین: شما چی فکر میکنید؟

جین: می دانم که راه رفتن خوب است، اما می دانم که می توانی از پس خودت بر بیایی. فقط به یاد داشته باشید که برای یک وعده غذایی واقعی به اینجا برگردید، نه برای چیزهای نودل مصنوعی که در بازار سرو می کنند.

من، به نوا: خانواده شما چگونه هستند؟

نوا: فقط من و من هستیم-[slight stutter]– گربه، ویسکرز. نگه داشتن قلعه اما جین و تو، کای، مثل خانواده ای هستند که من برای خودم انتخاب می کنم.

من به جین: خب من چطوری دوباره شما رو بشناسم؟

جین: من همان کسی هستم که برای شما تاپینگ های اضافی را به روی مردان ray شما می زدم [note awkward pronunciation change] وقتی بچه بودی، بیشتر از گربه های ولگردی که در کوچه پشتی آویزان بودند به آن نیاز داشتی.

من، به نوا: بعد از این چه کار داری؟

نوا: ممکن است برای نوشیدنی به لوتوس بروم. آیا می‌خواهید بپیوندید؟ مدتی بود که شبانه بیرون رفتیم.

من: مطمئنا، فیلم خوبی در حال پخش است؟

نوا: ببینیم چیه –[slight pause]– در سینماهای هولوسویت. اگر نه، ما همیشه می توانیم یک کلاسیک را در محل من بگیریم. من آرشیو کامل را دارم

من به جین: می خواهید به ما بپیوندید؟

جین: می گذرم، ممنون. این مجسمه گربه قدیمی روی پیشخوان برای من شانس بیشتری از یک شب در شهر به ارمغان می آورد.

من: قرار است در عوض چه کاری انجام دهید؟

جین: من فقط قلعه را در اینجا نگه می دارم و مطمئن می شوم که سرگردان های آخر شب از نودل خود استفاده کنند. این یک کار پر زرق و برق نیست، اما این چیزی است که من در آن مهارت دارم.

دیالوگ به خصوص الهام بخش نیست! من مطمئناً آن را به خطوط مناسب از شخصیت های خوب در بازی های مورد علاقه ام ترجیح نمی دهم. شما همچنین می توانید ببینید که چگونه آنها فقط در فواصل کوتاه صحبت می کنند و چگونه آنها گاهی اوقات موضوع را گم می کنند. اما شاید بتوان از آن برای پر کردن یک جهان با شخصیت‌های کوچک‌تر استفاده کرد یا با دیالوگ‌های خوب و متعارفی که توسط یک انسان واقعی نوشته شده است، ترکیب کرد، جایی که هوش مصنوعی مولد به آن کمک می‌کند تا جلوتر برود.

پس از مکالمه، نایلا ورکر، رئیس محصول Convai، برخی از زیربناهای داشبورد مبتنی بر مرورگر شرکت را به من نشان داد.

جین و نوا، می‌توانستم ببینم، «شرح شخصیت»، «بانک دانش» خود پر از اسناد متنی هستند که می‌توانند به آنها مراجعه کنند، لغزنده‌هایی برای ویژگی‌های «شخصیت» مانند برون‌گرایی، گشودگی، و حساسیت، «وضعیت» خودشان. ذهن،” برخی از “گاردریل” برای جلوگیری از آنها امیدواریم انجام کارهای عجیب هوش مصنوعی (و فیلتر برای کلمات مسدود شده)، و همچنین یک بانک حافظه. کارگر می‌گوید Convai هنوز روی حافظه بلندمدت کار می‌کند، اما موتور مکالمه می‌تواند ارزش چند ساعتی را ذخیره کند.

یک عکس فوری که من از رابط Convai گرفتم.  من پشیمانم که جین را روی آن تنظیم نکردم
یک عکس فوری که من از رابط Convai گرفتم. من متاسفم که جین را “آزاردهنده” نکردم تا ببینم پاسخ های او چگونه تغییر می کند.

او همچنین به من نشان داد که تزریق داده های جدید چقدر آسان است. تنها یک ضربه روی یک دکمه طول کشید تا حافظه جین و نوا با یک فایل متنی اضافی اصلاح شود و ناگهان آنها توانستند به من در مورد کارت گرافیک های جدید انویدیا. دکمه دیگری را فشار دهید و این کاراکترها می توانند به زبان جدیدی صحبت کنند.

از آنجایی که من در واقع با دنیای تخیلی که جین و نوا از نظر تئوری در آن زندگی می کنند تعامل نداشتم، نمی توانم به طور کامل تشخیص دهم که آنها چه توانایی هایی دارند. آنها در حال حاضر بسیار دو بعدی به نظر می رسند، با “من یک مغازه دار مغرور و فداکار رامن با یک دستور پخت مخفی هستم” کل schtick جین است. اما من دوست دارم ببینم یک نویسنده خوب با پیشینه و انگیزه هایش چه کاری می تواند انجام دهد. اکنون کاملاً می توانم بازی هایی را تصور کنم که NPC ها آنچه را که دیده اند به خاطر می آورند و در حین باز شدن به اسکریپت بازی واکنش نشان می دهند. بیت‌های مناسب می‌توانند در زمان مناسب وارد بانک حافظه آن‌ها شوند، از طریق شخصیت و خواسته‌های آن‌ها فیلتر شوند و در نتیجه بازی را فراگیرتر و تعاملی‌تر کنند.

فقط امیدوارم توسعه دهندگان بازی از این استفاده کنند تقویت کردن بازی های آنها به جای بیکار کردن صداپیشگان و نویسندگان. این یک موضوع بسیار داغ در صنعت بازی در حال حاضر است.

فقط این ماه SAG-AFTRA با استودیو Replica قراردادی امضا کرد که می تواند به اعضا اجازه دهد تا از تکرار دیجیتالی صدای خود مجوز بگیرند. برخی از اعضا کاملاً صریح هستند که این معامله بیانگر نظرات آنها نیست. آخرین باری که شنیدیم، اتحادیه کارگری هنوز در حال مذاکره با ناشران بازی برای توافقنامه رسانه تعاملی جدید است. فهرست کرده است “تهدید وجودی برای کار اعضا ناشی از استفاده غیرقانونی از هوش مصنوعی” به عنوان یکی از نگرانی های اصلی آن است.


منبع: https://www.theverge.com/24031687/nvidia-ai-npcs-convai-ces-2023

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *