اد نیوتن رکس به نقطه شکست رسیده بود. به عنوان معاون صدا در Stability AI، این مرد ۳۶ ساله پیشرو یک انقلاب در خلاقیت محاسباتی بود. اما نگرانی فزاینده ای در مورد استراتژی جنبش وجود داشت.
ثبات در حال تبدیل شدن به یک نیروگاه در حال ظهور بود هوش مصنوعی. مستقر در لندن استارت آپ مالک Stability Diffusion، یکی از محبوب ترین تولیدکننده های تصویر در جهان است. همچنین اخیراً با راهاندازی Stable Audio در سپتامبر – ابزاری که توسط خود نیوتن رکس توسعه یافته است – به تولیدکنندههای موسیقی نیز گسترش یافته است. اما این دو سیستم مسیرهای متضادی را طی می کردند.
صدای پایدار بر روی موسیقی مجاز آموزش داده شد. این مدل با مجموعه داده ای متشکل از ۸۰۰۰۰۰ فایل از کتابخانه موسیقی سهام AudioSparx تغذیه شد. هر گونه مطالب دارای حق چاپ با اجازه ارائه شده است.
Stable Diffusion در جهت دیگری پیش رفته بود. این سیستم بر روی میلیاردها تصویر خراشیده شده از وب بدون رضایت سازندگان آموزش داده شد. بسیاری از مطالب دارای حق چاپ بودند. همه بدون پرداخت پول گرفته شد.
این تصاویر به خوبی به مدل آموزش داده بود. خروجی های Diffusion استیبیل را به ارزش ۱ میلیارد دلار در ۱۰۱ دلار سوق داد.منگنز دور تامین مالی سال گذشته اما این سیستم با مخالفت هنرمندان – از جمله نیوتن رکس – مواجه شد.
معضل اخلاقی GenAI
یک پیانیست و آهنگساز نیوتن رکس و همچنین یکی از پیشگامان GenAI، در تضاد با خراش دادن غیرمجاز بود.
او در یک تماس ویدیویی از خانهاش در سیلیکون ولی به TNW میگوید: «من همیشه واقعاً میخواستم مطمئن شوم که این ابزارها با رضایت سازندگان پشت دادههای آموزشی ساخته شدهاند.
ثبات به دور از تنها بیانگر این روش بود. مولدهای تصویر MidJourney و Dall-E همان رویکرد را اعمال می کنند، همانطور که مولد متن ChatGPT و برنامه نویس CoPilot از OpenAI استفاده می کنند. هنرهای تجسمی، آثار نوشتاری، موسیقی و حتی کدها در حال حاضر دائماً بدون رضایت در حال بازسازی هستند.
در پاسخ، سازندگان و دارندگان حق چاپ راه اندازی شده اند متعدد دعاوی حقوقی. آنها از اینکه کارشان بدون اجازه یا پاداش گرفته میشود، اقتباس و درآمدزایی میشود، عصبانی هستند. آنها همچنین نگران هستند که معیشت آنها در خطر باشد.
این به نفع صنعت هوش مصنوعی است که مردم فکر کنند که تنها بازیگران بزرگ می توانند این کار را انجام دهند.
هنرمندان می گویند که هوش مصنوعی مولد کار آنها را می دزدد. شرکتهای پشت این سیستمها مخالف هستند. در یک ارسال اخیر به اداره حق نسخه برداری ایالات متحده، ثبات استدلال کرد که آموزش “استفاده منصفانه” بود، زیرا نتایج “تحول کننده” و “از نظر اجتماعی مفید” است.
در نتیجه، شرکت ادعا کرد، هیچ نقض حق چاپ وجود ندارد. بنابراین این عمل می تواند بدون اجازه یا پرداخت ادامه یابد. این ادعایی بود که در GenAI رایج شده بود، اما ادعایی که نیوتن رکس با آن مخالفت کرد.
او میگوید: «این واقعاً نشان داد که صنعت بهعنوان یک کل در حال حاضر کجاست – و جایی نیست که من از آن راضی باشم.
نیوتن رکس عمل استثمار را در نظر می گیرد. هفته گذشته، او استعفا داد از ثبات در اعتراض
خروج نیوتن رکس به این معنا نیست که هوش مصنوعی مولد را کنار گذاشته است. برعکس، او قصد دارد به کار در این زمینه ادامه دهد، اما از الگوی منصفانه تری پیروی کند. این ماموریت غیرممکنی نیست که غول های GenAI ممکن است به تصویر بکشند. در واقع، قبلاً توسط طیف وسیعی از شرکت ها انجام شده است.
گزینه های جایگزین موجود است
نیوتن رکس سابقه طولانی در خلاقیت محاسباتی دارد. او پس از تحصیل در رشته موسیقی در دانشگاه کمبریج، جوکدک، آهنگساز پیشگام هوش مصنوعی را تأسیس کرد. برنامه استفاده شده فراگیری ماشین برای ساخت موسیقی اصلی در صورت تقاضا. در سال ۲۰۱۹، توسط مالک TikTok Bytedance خریداری شد.
نیوتن رکس پس از آن به عنوان مدیر محصول در Tiktok و مدیر محصول در Voicey، یک برنامه همکاری موسیقی که توسط اسنپ خریداری شده بود، پیش از پیوستن به Stability AI در سال گذشته، مشغول به کار شد. او وظیفه رهبری تلاش های صوتی این استارتاپ را بر عهده داشت.
او میگوید: «من میخواستم محصولی در نسل موسیقی بسازم که نشان دهد با دادههای مجاز واقعی چه کاری میتوان انجام داد – جایی که شما با دارندگان حقوق موافق هستید.
این هدف او را با بسیاری از رهبران صنعت در تضاد قرار داد. GenAI در حال ورود به جریان اصلی بود و شرکت ها برای ارسال سیستم های جدید در سریع ترین زمان ممکن عجله داشتند. حذف محتوا از وب یک میانبر جذاب بود.
همچنین به وضوح موثر بود. در آن زمان، هنوز شک و تردیدهایی وجود داشت که مجموعه داده های مجاز برای آموزش مدل های پیشرفته به اندازه کافی بزرگ هستند. همچنین سوالاتی در مورد کیفیت داده ها مطرح شد. اما هر دوی این فرضیه ها اکنون رد می شوند.
«آنچه ما دادههای آموزشی مینامیم، در واقع خروجی خلاقانه انسان است.
صدای پایدار یکی از منابع ضد شواهد را ارائه کرد. مدل زیربنایی این سیستم با مشارکت صاحبان حقوق بر روی موسیقی مجاز آموزش داده شد. خروجی های به دست آمده مورد تشویق قرار گرفته است. ماه گذشته، تایم، Stable Audio را یکی از آنها معرفی کرد بهترین اختراعات سال ۲۰۲۳٫
نیوتن رکس میگوید: «برای چند ماه، این بهترین هنر در نسل موسیقی بود – و بر روی موسیقی که ما مجوز آن را میدادیم آموزش داده شد. برای من، این نشان داد که می توان آن را انجام داد.»
در واقع، اکنون فهرست رو به رشدی از شرکت ها وجود دارد که نشان می دهد این کار می تواند انجام شود. یکی از آنها Adobe است که اخیراً یک مدل یادگیری ماشینی تولیدی به نام Firefly منتشر کرده است. این سیستم بر روی تصاویر Creative Commons، Wikimedia و Flickr Commons و همچنین ۳۰۰ میلیون عکس و ویدیو در Adobe Stock و دامنه عمومی آموزش داده شده است.
از آنجایی که این داده ها با اجازه ارائه می شوند، برای استفاده تجاری بی خطر هستند. ادوبی همچنین تاکید کرد که سازندگانی که از آثارشان استفاده می شود واجد شرایط پرداخت خواهند بود.
مدل جایگزین دیگر از Getty Images می آید. در ماه سپتامبر، این شرکت هوش مصنوعی Generative توسط Getty Images را راهاندازی کرد که تنها در کتابخانه عظیم این پلتفرم آموزش داده شده است. کریگ پیترز، مدیر عامل شرکت، گفت که این ابزار “نیازهای تجاری را در عین احترام به مالکیت معنوی سازندگان” برطرف می کند.
Nvidia همچنین GenAI را با مشارکت دارندگان حق چاپ توسعه داده است. سرویس پیکاسو غول فناوری بر روی تصاویر دارای مجوز از Getty Images، Shutterstock و Adobe آموزش دیده است. انویدیا اعلام کرد که قصد دارد حق امتیاز پرداخت کند.
این رویکردها برای همه کار نخواهد کرد. شرکتهایی که پشت سر آنها قرار دارند، بهعنوان یک شرکت بزرگ با استخرهای محتوای عمیق، منابعی دارند که تعداد کمی از کسبوکارها میتوانند با آنها مطابقت داشته باشند. با این حال استارتاپ ها هستند نشان می دهد که صدور مجوز نیز با بودجه قابل انجام است.
GenAI برای مردم
هوش مصنوعی بریا یک مثال آورده است. این شرکت یک مدل منبع باز تجاری جدید برای تولید تصویر با کیفیت بالا توسعه داده است. تمام آموزشها بر روی مجموعه دادههای دارای مجوز انجام میشود که با همکاری آژانسهای عکس و هنرمندان پیشرو ایجاد شدهاند. مدل تسهیم درآمد به پدیدآورندگان و صاحبان حقوق برای سهمشان جبران میکند
این رویکرد مشابه روشی است که نیوتن رکس در Stable Audio استفاده می کند – اما این تنها روش نیست.
شرکتها همچنین میتوانند پیشپرداختهایی را به هنرمندان ارائه کنند، سرمایهگذاریهای مشترکی ایجاد کنند که به صاحبان حقوق در کسبوکار دارای حقوقی برابر باشد، یا از محتوایی با مجوز Creative Commons استفاده کنند، که میتواند آزادانه و بدون اجازه صریح مجدداً استفاده شود. شرکتهای GenAI ممکن است این تلاشها را رد کنند، اما آنها انگیزههای پنهانی دارند.
نیوتن رکس میگوید: «این به نفع صنعت هوش مصنوعی است که مردم فکر کنند فقط بازیگران بزرگ میتوانند این کار را انجام دهند – اما این درست نیست.
“شاید لازم باشد کمی اختراع کنید. مطمئناً باید مذاکراتی انجام دهید و مایل به صرف زمان باشید. اما در نهایت، آنچه ما داده های آموزشی می نامیم – و آنچه واقعاً خروجی خلاق انسان است – منبعی برای شرکت های فناوری است. آنها باید برای به دست آوردن آن کار کنند، همان طور که برای به دست آوردن هر منبعی باید تلاش کنند.»
اگر آنها مایل به انجام این کار هستند، GenAI می تواند با هنرمندان انسانی هماهنگ کار کند. و امیدوارم همه ما از خلاقیت هر دوی آنها لذت ببریم.
منبع: https://thenextweb.com/news/ed-newton-rex-making-generative-ai-fair