انتظار می رود سیل عمیق از پیشرفت تولید تصویر هوش مصنوعی (اینقدر طولانی است، LoRA؟)

یک روش جدید تولید تصویر هوش مصنوعی، InstantIDبا توجه به a کاغذ جدید توسط تیم InstantX در پکن منتشر شده است.

با این حال، روون کوهن، مشاور هوش مصنوعی سازمانی برای شرکت‌های Fortune 500 که InstantID را «جدیدترین پیشرفته‌ترین» می‌نامد، به VentureBeat گفت که این تکنیک جدید یک نقطه ضعف بزرگ دارد: این روش باعث ایجاد سیل صوتی، تصاویر و تصاویر عمیق می‌شود. ابزارهای ویدئویی، درست به موقع برای انتخابات ۲۰۲۴٫

او گفت: «استفاده از ابزارهایی مانند InstantID برای دیپ فیک به دلیل سهولت ایجاد و سازگاری خروجی بدون نیاز به آموزش یا تنظیم دقیق، نگرانی های قابل توجهی را ایجاد می کند. توانایی InstantID برای تولید موثر محتوای حفظ هویت می‌تواند منجر به ایجاد جعلی‌های عمیق واقعی و متقاعدکننده بدون نیاز به GPU و منابع کمی از CPU شود.

InstantID برای تولید تصویر با هوش مصنوعی قابل شناسایی از LoRA پیشی می گیرد

او توضیح داد که InstantID پیشی گرفته است LoRA – مدل‌های کوچک و با تنظیم دقیق که بر روی تعداد کمی از پارامترها مانند شخصیت‌ها یا سبک‌های خاص آموزش دیده‌اند – که منجر به انفجاری از خلاقیت‌های علاقه‌مندان به LoRA شده است که در پلتفرم های بحث برانگیز پسندیدن از دولت. اینها شامل همه چیز می شود، از فن تخیلی و شخصیت های انیمه تولید شده توسط هوش مصنوعی گرفته تا فتو رئالیسم و ​​حتی مد – اما LoRA مسلماً بهترین است. مشهور – معروف برای تولید پورن و دیپ فیک.

کوهن ارسال شده در مورد روش جدید InstantID دیروز در LinkedIn که می گوید “خیلی طولانی، LoRA”، و InstantID را “جعلی عمیق در استروئیدها” می نامد.

مقاله تیم InstantX، InstantID: Zero-shot Identity-Preserving Generation in Seconds، گفت که تکنیک هایی مانند LoRA به دلیل تقاضای بالای ذخیره سازی، فرآیندهای تنظیم دقیق طولانی و نیاز به تصاویر مرجع متعدد مانع می شوند. روش‌های موجود مبتنی بر تعبیه شناسه نیز با چالش‌هایی روبرو بوده‌اند، اما InstantID یک ماژول Plug and Play ارائه می‌کند که «به طرز ماهرانه‌ای شخصی‌سازی تصویر را در سبک‌های مختلف تنها با استفاده از یک تصویر تک چهره انجام می‌دهد و در عین حال وفاداری بالا را تضمین می‌کند».

کوهن توضیح داد که InstantID ابزاری برای تولید هویت صفر شات است که به طور قابل توجهی با LoRA و QLoRA متفاوت است – روشی که رویکرد LoRA را با ساده‌سازی یا کوچک کردن داده‌های مدل گسترش می‌دهد و منابع مورد نیاز برای تنظیم دقیق را کاهش می‌دهد.

او گفت که تا به حال، QLoRA پیشرفته بود. در حالی که LoRA و QLoRA تکنیک‌هایی برای تنظیم دقیق مدل‌ها با به‌روزرسانی زیرمجموعه‌ای از پارامترهای مدل یا اعمال کمیت برای کارایی هستند، InstantID بر تولید خروجی‌هایی تمرکز می‌کند که ویژگی‌های هویت داده‌های ورودی را با رویکردی سریع و کارآمد حفظ می‌کنند.»

ایجاد دیپ فیک با هوش مصنوعی ساده تر از همیشه است

عملکرد اولیه InstantID مستقیماً به تنظیم دقیق مدل‌ها مربوط نمی‌شود، بلکه بیشتر به حفظ جنبه‌های هویتی در محتوای تولید شده مربوط می‌شود. دونالد ترامپ همیشه شبیه دونالد ترامپ است.

و اکنون، او هشدار داد، مهندسی سریع یک دیپ‌فیک آسان‌تر نیست. “به معنای واقعی کلمه یک کلیک برای استقرار این روی صورت در آغوش گرفته یا تکرار کنید.»

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/deepfake-deluge-expected-from-ai-image-generation-breakthrough-so-long-lora/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *