او در اعتراض به یکی از رهبران GenAI استعفا داد. اکنون او می خواهد سیستم های منصفانه تری برای هنرمندان ایجاد کند

اد نیوتن رکس به نقطه شکست رسیده بود. به عنوان معاون صدا در Stability AI، این مرد ۳۶ ساله پیشرو یک انقلاب در خلاقیت محاسباتی بود. اما نگرانی فزاینده ای در مورد استراتژی جنبش وجود داشت.

ثبات در حال تبدیل شدن به یک نیروگاه در حال ظهور بود هوش مصنوعی. مستقر در لندن استارت آپ مالک Stability Diffusion، یکی از محبوب ترین تولیدکننده های تصویر در جهان است. همچنین اخیراً با راه‌اندازی Stable Audio در سپتامبر – ابزاری که توسط خود نیوتن رکس توسعه یافته است – به تولیدکننده‌های موسیقی نیز گسترش یافته است. اما این دو سیستم مسیرهای متضادی را طی می کردند.

صدای پایدار بر روی موسیقی مجاز آموزش داده شد. این مدل با مجموعه داده ای متشکل از ۸۰۰۰۰۰ فایل از کتابخانه موسیقی سهام AudioSparx تغذیه شد. هر گونه مطالب دارای حق چاپ با اجازه ارائه شده است.

Stable Diffusion در جهت دیگری پیش رفته بود. این سیستم بر روی میلیاردها تصویر خراشیده شده از وب بدون رضایت سازندگان آموزش داده شد. بسیاری از مطالب دارای حق چاپ بودند. همه بدون پرداخت پول گرفته شد.

این تصاویر به خوبی به مدل آموزش داده بود. خروجی های Diffusion استیبیل را به ارزش ۱ میلیارد دلار در ۱۰۱ دلار سوق داد.منگنز دور تامین مالی سال گذشته اما این سیستم با مخالفت هنرمندان – از جمله نیوتن رکس – مواجه شد.

معضل اخلاقی GenAI

یک پیانیست و آهنگساز نیوتن رکس و همچنین یکی از پیشگامان GenAI، در تضاد با خراش دادن غیرمجاز بود.

او در یک تماس ویدیویی از خانه‌اش در سیلیکون ولی به TNW می‌گوید: «من همیشه واقعاً می‌خواستم مطمئن شوم که این ابزارها با رضایت سازندگان پشت داده‌های آموزشی ساخته شده‌اند.

ثبات به دور از تنها بیانگر این روش بود. مولدهای تصویر MidJourney و Dall-E همان رویکرد را اعمال می کنند، همانطور که مولد متن ChatGPT و برنامه نویس CoPilot از OpenAI استفاده می کنند. هنرهای تجسمی، آثار نوشتاری، موسیقی و حتی کدها در حال حاضر دائماً بدون رضایت در حال بازسازی هستند.

در پاسخ، سازندگان و دارندگان حق چاپ راه اندازی شده اند متعدد دعاوی حقوقی. آن‌ها از اینکه کارشان بدون اجازه یا پاداش گرفته می‌شود، اقتباس و درآمدزایی می‌شود، عصبانی هستند. آنها همچنین نگران هستند که معیشت آنها در خطر باشد.

این به نفع صنعت هوش مصنوعی است که مردم فکر کنند که تنها بازیگران بزرگ می توانند این کار را انجام دهند.

هنرمندان می گویند که هوش مصنوعی مولد کار آنها را می دزدد. شرکت‌های پشت این سیستم‌ها مخالف هستند. در یک ارسال اخیر به اداره حق نسخه برداری ایالات متحده، ثبات استدلال کرد که آموزش “استفاده منصفانه” بود، زیرا نتایج “تحول کننده” و “از نظر اجتماعی مفید” است.

در نتیجه، شرکت ادعا کرد، هیچ نقض حق چاپ وجود ندارد. بنابراین این عمل می تواند بدون اجازه یا پرداخت ادامه یابد. این ادعایی بود که در GenAI رایج شده بود، اما ادعایی که نیوتن رکس با آن مخالفت کرد.

او می‌گوید: «این واقعاً نشان داد که صنعت به‌عنوان یک کل در حال حاضر کجاست – و جایی نیست که من از آن راضی باشم.

نیوتن رکس عمل استثمار را در نظر می گیرد. هفته گذشته، او استعفا داد از ثبات در اعتراض

خروج نیوتن رکس به این معنا نیست که هوش مصنوعی مولد را کنار گذاشته است. برعکس، او قصد دارد به کار در این زمینه ادامه دهد، اما از الگوی منصفانه تری پیروی کند. این ماموریت غیرممکنی نیست که غول های GenAI ممکن است به تصویر بکشند. در واقع، قبلاً توسط طیف وسیعی از شرکت ها انجام شده است.

گزینه های جایگزین موجود است

نیوتن رکس سابقه طولانی در خلاقیت محاسباتی دارد. او پس از تحصیل در رشته موسیقی در دانشگاه کمبریج، جوکدک، آهنگساز پیشگام هوش مصنوعی را تأسیس کرد. برنامه استفاده شده فراگیری ماشین برای ساخت موسیقی اصلی در صورت تقاضا. در سال ۲۰۱۹، توسط مالک TikTok Bytedance خریداری شد.

نیوتن رکس پس از آن به عنوان مدیر محصول در Tiktok و مدیر محصول در Voicey، یک برنامه همکاری موسیقی که توسط اسنپ خریداری شده بود، پیش از پیوستن به Stability AI در سال گذشته، مشغول به کار شد. او وظیفه رهبری تلاش های صوتی این استارتاپ را بر عهده داشت.

او می‌گوید: «من می‌خواستم محصولی در نسل موسیقی بسازم که نشان دهد با داده‌های مجاز واقعی چه کاری می‌توان انجام داد – جایی که شما با دارندگان حقوق موافق هستید.

این هدف او را با بسیاری از رهبران صنعت در تضاد قرار داد. GenAI در حال ورود به جریان اصلی بود و شرکت ها برای ارسال سیستم های جدید در سریع ترین زمان ممکن عجله داشتند. حذف محتوا از وب یک میانبر جذاب بود.

همچنین به وضوح موثر بود. در آن زمان، هنوز شک و تردیدهایی وجود داشت که مجموعه داده های مجاز برای آموزش مدل های پیشرفته به اندازه کافی بزرگ هستند. همچنین سوالاتی در مورد کیفیت داده ها مطرح شد. اما هر دوی این فرضیه ها اکنون رد می شوند.

«آنچه ما داده‌های آموزشی می‌نامیم، در واقع خروجی خلاقانه انسان است.

صدای پایدار یکی از منابع ضد شواهد را ارائه کرد. مدل زیربنایی این سیستم با مشارکت صاحبان حقوق بر روی موسیقی مجاز آموزش داده شد. خروجی های به دست آمده مورد تشویق قرار گرفته است. ماه گذشته، تایم، Stable Audio را یکی از آن‌ها معرفی کرد بهترین اختراعات سال ۲۰۲۳٫

نیوتن رکس می‌گوید: «برای چند ماه، این بهترین هنر در نسل موسیقی بود – و بر روی موسیقی که ما مجوز آن را می‌دادیم آموزش داده شد. برای من، این نشان داد که می توان آن را انجام داد.»

در واقع، اکنون فهرست رو به رشدی از شرکت ها وجود دارد که نشان می دهد این کار می تواند انجام شود. یکی از آنها Adobe است که اخیراً یک مدل یادگیری ماشینی تولیدی به نام Firefly منتشر کرده است. این سیستم بر روی تصاویر Creative Commons، Wikimedia و Flickr Commons و همچنین ۳۰۰ میلیون عکس و ویدیو در Adobe Stock و دامنه عمومی آموزش داده شده است.

از آنجایی که این داده ها با اجازه ارائه می شوند، برای استفاده تجاری بی خطر هستند. ادوبی همچنین تاکید کرد که سازندگانی که از آثارشان استفاده می شود واجد شرایط پرداخت خواهند بود.

تصاویر این کلاژ توسط Adobe Firefly تولید شده است که بر روی تصاویر دارای مجوز آموزش دیده است. اعتبار: Adobe

مدل جایگزین دیگر از Getty Images می آید. در ماه سپتامبر، این شرکت هوش مصنوعی Generative توسط Getty Images را راه‌اندازی کرد که تنها در کتابخانه عظیم این پلتفرم آموزش داده شده است. کریگ پیترز، مدیر عامل شرکت، گفت که این ابزار “نیازهای تجاری را در عین احترام به مالکیت معنوی سازندگان” برطرف می کند.

Nvidia همچنین GenAI را با مشارکت دارندگان حق چاپ توسعه داده است. سرویس پیکاسو غول فناوری بر روی تصاویر دارای مجوز از Getty Images، Shutterstock و Adobe آموزش دیده است. انویدیا اعلام کرد که قصد دارد حق امتیاز پرداخت کند.

این رویکردها برای همه کار نخواهد کرد. شرکت‌هایی که پشت سر آن‌ها قرار دارند، به‌عنوان یک شرکت بزرگ با استخرهای محتوای عمیق، منابعی دارند که تعداد کمی از کسب‌وکارها می‌توانند با آن‌ها مطابقت داشته باشند. با این حال استارتاپ ها هستند نشان می دهد که صدور مجوز نیز با بودجه قابل انجام است.

GenAI برای مردم

هوش مصنوعی بریا یک مثال آورده است. این شرکت یک مدل منبع باز تجاری جدید برای تولید تصویر با کیفیت بالا توسعه داده است. تمام آموزش‌ها بر روی مجموعه داده‌های دارای مجوز انجام می‌شود که با همکاری آژانس‌های عکس و هنرمندان پیشرو ایجاد شده‌اند. مدل تسهیم درآمد به پدیدآورندگان و صاحبان حقوق برای سهمشان جبران می‌کند

این رویکرد مشابه روشی است که نیوتن رکس در Stable Audio استفاده می کند – اما این تنها روش نیست.

شرکت‌ها همچنین می‌توانند پیش‌پرداخت‌هایی را به هنرمندان ارائه کنند، سرمایه‌گذاری‌های مشترکی ایجاد کنند که به صاحبان حقوق در کسب‌وکار دارای حقوقی برابر باشد، یا از محتوایی با مجوز Creative Commons استفاده کنند، که می‌تواند آزادانه و بدون اجازه صریح مجدداً استفاده شود. شرکت‌های GenAI ممکن است این تلاش‌ها را رد کنند، اما آنها انگیزه‌های پنهانی دارند.

نیوتن رکس می‌گوید: «این به نفع صنعت هوش مصنوعی است که مردم فکر کنند فقط بازیگران بزرگ می‌توانند این کار را انجام دهند – اما این درست نیست.

“شاید لازم باشد کمی اختراع کنید. مطمئناً باید مذاکراتی انجام دهید و مایل به صرف زمان باشید. اما در نهایت، آنچه ما داده های آموزشی می نامیم – و آنچه واقعاً خروجی خلاق انسان است – منبعی برای شرکت های فناوری است. آنها باید برای به دست آوردن آن کار کنند، همان طور که برای به دست آوردن هر منبعی باید تلاش کنند.»

اگر آنها مایل به انجام این کار هستند، GenAI می تواند با هنرمندان انسانی هماهنگ کار کند. و امیدوارم همه ما از خلاقیت هر دوی آنها لذت ببریم.


منبع: https://thenextweb.com/news/ed-newton-rex-making-generative-ai-fair

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *