یک روش جدید تولید تصویر هوش مصنوعی، InstantIDبا توجه به a کاغذ جدید توسط تیم InstantX در پکن منتشر شده است.
با این حال، روون کوهن، مشاور هوش مصنوعی سازمانی برای شرکتهای Fortune 500 که InstantID را «جدیدترین پیشرفتهترین» مینامد، به VentureBeat گفت که این تکنیک جدید یک نقطه ضعف بزرگ دارد: این روش باعث ایجاد سیل صوتی، تصاویر و تصاویر عمیق میشود. ابزارهای ویدئویی، درست به موقع برای انتخابات ۲۰۲۴٫
او گفت: «استفاده از ابزارهایی مانند InstantID برای دیپ فیک به دلیل سهولت ایجاد و سازگاری خروجی بدون نیاز به آموزش یا تنظیم دقیق، نگرانی های قابل توجهی را ایجاد می کند. توانایی InstantID برای تولید موثر محتوای حفظ هویت میتواند منجر به ایجاد جعلیهای عمیق واقعی و متقاعدکننده بدون نیاز به GPU و منابع کمی از CPU شود.
InstantID برای تولید تصویر با هوش مصنوعی قابل شناسایی از LoRA پیشی می گیرد
او توضیح داد که InstantID پیشی گرفته است LoRA – مدلهای کوچک و با تنظیم دقیق که بر روی تعداد کمی از پارامترها مانند شخصیتها یا سبکهای خاص آموزش دیدهاند – که منجر به انفجاری از خلاقیتهای علاقهمندان به LoRA شده است که در پلتفرم های بحث برانگیز پسندیدن از دولت. اینها شامل همه چیز می شود، از فن تخیلی و شخصیت های انیمه تولید شده توسط هوش مصنوعی گرفته تا فتو رئالیسم و حتی مد – اما LoRA مسلماً بهترین است. مشهور – معروف برای تولید پورن و دیپ فیک.
کوهن ارسال شده در مورد روش جدید InstantID دیروز در LinkedIn که می گوید “خیلی طولانی، LoRA”، و InstantID را “جعلی عمیق در استروئیدها” می نامد.
مقاله تیم InstantX، InstantID: Zero-shot Identity-Preserving Generation in Seconds، گفت که تکنیک هایی مانند LoRA به دلیل تقاضای بالای ذخیره سازی، فرآیندهای تنظیم دقیق طولانی و نیاز به تصاویر مرجع متعدد مانع می شوند. روشهای موجود مبتنی بر تعبیه شناسه نیز با چالشهایی روبرو بودهاند، اما InstantID یک ماژول Plug and Play ارائه میکند که «به طرز ماهرانهای شخصیسازی تصویر را در سبکهای مختلف تنها با استفاده از یک تصویر تک چهره انجام میدهد و در عین حال وفاداری بالا را تضمین میکند».
کوهن توضیح داد که InstantID ابزاری برای تولید هویت صفر شات است که به طور قابل توجهی با LoRA و QLoRA متفاوت است – روشی که رویکرد LoRA را با سادهسازی یا کوچک کردن دادههای مدل گسترش میدهد و منابع مورد نیاز برای تنظیم دقیق را کاهش میدهد.
او گفت که تا به حال، QLoRA پیشرفته بود. در حالی که LoRA و QLoRA تکنیکهایی برای تنظیم دقیق مدلها با بهروزرسانی زیرمجموعهای از پارامترهای مدل یا اعمال کمیت برای کارایی هستند، InstantID بر تولید خروجیهایی تمرکز میکند که ویژگیهای هویت دادههای ورودی را با رویکردی سریع و کارآمد حفظ میکنند.»
ایجاد دیپ فیک با هوش مصنوعی ساده تر از همیشه است
عملکرد اولیه InstantID مستقیماً به تنظیم دقیق مدلها مربوط نمیشود، بلکه بیشتر به حفظ جنبههای هویتی در محتوای تولید شده مربوط میشود. دونالد ترامپ همیشه شبیه دونالد ترامپ است.
و اکنون، او هشدار داد، مهندسی سریع یک دیپفیک آسانتر نیست. “به معنای واقعی کلمه یک کلیک برای استقرار این روی صورت در آغوش گرفته یا تکرار کنید.»
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/deepfake-deluge-expected-from-ai-image-generation-breakthrough-so-long-lora/