Stability AI توربوشارژ تولید متن به تصویر را با SDXL Turbo می کند

آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.

تولید تصاویر با هوش مصنوعی از یک پیام نوشتاری ساده سریعتر می شود – به لطف روش های جدیدی که توسط Stability AI، خالق مدل پرکاربرد Stable Diffusion، به کار گرفته شده است، بسیار سریعتر از همیشه قبل.

دیگر نیازی نیست که انسان‌ها ثانیه‌ها یا حتی دقیقه‌های ارزشمند خود را در انتظار هدر دادن هوش مصنوعی برای تولید تصویر بر اساس درخواست خود تلف کنند. با حالت جدید SDXL Turbo که امروز توسط Stability AI معرفی شد، تولید تصاویر بلادرنگ اکنون در دسترس عموم قرار گرفته است.

این به لطف کاهش گسترده در مراحل تولید است – آنچه قبلاً ۵۰ قدم برداشته می شد اکنون یک مرحله را انجام می دهد. این همچنین منجر به کاهش بار محاسباتی می شود. با توجه به AI Stability، SDXL Turbo می‌تواند تصویری با ابعاد ۵۱۲×۵۱۲ را تنها در ۲۰۷ میلی‌ثانیه بر روی یک پردازنده گرافیکی A100 تولید کند که نسبت به مدل‌های قبلی با هوش مصنوعی بهبود یافته است.

تجربه کلی SDXL Turbo بسیار یادآور این است که چگونه گوگل (و سایر فروشندگان جستجو، مرورگر و سیستم عامل) اکنون تایپ پیش‌بینی‌کننده را برای درخواست‌ها فعال می‌کنند، با این تفاوت که این برای تولید تصویر با سرعت فکر است.

رویداد VB

تور تاثیر هوش مصنوعی

در تور AI Impact VentureBeat که به شهر نزدیک شما می آید، با جامعه هوش مصنوعی سازمانی ارتباط برقرار کنید!

بیشتر بدانید

گاهی اوقات، سرعت بیشتر از سخت افزار سریعتر ناشی می شود، اما در اینجا اینطور نیست. این نوعی سخت‌افزار فوق‌شارژ نیست که شتاب توربو را برای SDXL فعال می‌کند، بلکه این یک تکنیک جدید است که هوش مصنوعی پایداری در مورد آن تحقیق کرده است و به نام Adversarial Diffusion Distillation (ADD) شناخته می‌شود.

عماد مستقع، بنیانگذار و مدیر عامل Stability AI در نامه ای نوشت: “یک مرحله ای Stable Diffusion XL با رویکرد جدید Adversarial Distilled Diffusion (ADD) ما. پست در X (توئیتر سابق). “تنوع کمتر، اما بسیار سریعتر و انواع بیشتری در راه است که جالب خواهد بود، به خصوص با سطح بالا و بیشتر..”

یک مرحله ای Stable Diffusion XL با رویکرد جدید Adversarial Distilled Diffusion (ADD).

تنوع کمتر، اما بسیار سریعتر و انواع بیشتری در راه است که جالب خواهد بود، به خصوص با سطح بالا و بیشتر.

در ۴ مرحله از SDXL 50 مرحله بهتر عمل می کند.

وبلاگ، نسخه ی نمایشی، وزن ها را بررسی کنید https://t.co/7Nc5gyjwq8 pic.twitter.com/CTtAxl7br7

— مادران (@EMostaque) 28 نوامبر ۲۰۲۳

SDXL – اما سریعتر!

را مدل پایه SDXL اولین بار توسط هوش مصنوعی پایداری در ماه جولای اعلام شد. در آن زمان، Mostaque به VentureBeat گفت که انتظار دارد این یک پایه محکم باشد که مدل‌های دیگر بر اساس آن ظهور کنند. انتشار پایدار با چندین مدل تولید متن به تصویر از جمله DALL-E و Midjourney از OpenAI رقابت می کند.

یکی از نوآوری‌های کلیدی که مدل اصلی SDXL را قادر می‌سازد، مفهوم ControlNets است که به ایجاد کنترل بهتر برای ترکیب تصویر کمک می‌کند. مدل پایه SDXL همچنین از ۳٫۵ میلیارد پارامتر بهره می برد که به گفته Mostaque دقت بهتری را ارائه می دهد زیرا مدل از مفاهیم بیشتری آگاه است.

SDXL Turbo بر اساس نوآوری های مدل پایه SDXL ساخته شده و تولید را سریعتر می کند.

با SDXL Turbo، هوش مصنوعی پایداری مسیری را دنبال می کند که برای توسعه هوش مصنوعی مولد مدرن به طور فزاینده ای رایج می شود. این مسیر ابتدا شامل توسعه دقیق ترین مدل ممکن، سپس بهینه سازی آن برای عملکرد است. این مسیری است که OpenAI با GPT 3.5 Turbo و اخیراً طی کرده است GPT-4 توربو.

در فرآیند شتاب بخشیدن به مدل های هوش مصنوعی مولد، اغلب با کیفیت و دقت یک معاوضه وجود دارد. این معاوضه به سختی در SDXL Turbo وجود دارد، با نتایج بسیار دقیق که کیفیت تصویر کمی کمتر از یک نسخه بدون شتاب SDXL است.

تقطیر انتشار مخالف (ADD) چیست؟

در هوش مصنوعی مفهوم a شبکه متخاصم مولد (GAN) به خوبی درک شده و برای کمک به ساخت شبکه های عصبی یادگیری عمیق که می توانند به سرعت پاسخ دهند استفاده می شود. برای تولید تصویر، انتشار پایدار حول مفهوم مدل انتشار ساخته شده است، که نوعی مدل است که فرآیند تکراری تری را برای تولید محتوا انجام می دهد و معمولاً به سرعت هوش مصنوعی مبتنی بر GAN نیست. ADD بهترین هر دو دنیا را می گیرد.

“هدف این کار ترکیب کیفیت نمونه برتر DM ها است [diffusion models] با سرعت ذاتی GAN ها” ADD گزارش تحقیق ایالت ها.

رویکرد تقطیر انتشار متخاصم (ADD) که توسط محققان پایداری هوش مصنوعی ایجاد شده است، تلاشی برای پیشی گرفتن از سایر رویکردهای هوش مصنوعی برای تولید تصویر است. به گفته محققان، ADD اولین روش برای باز کردن قفل سنتز تصویر تک مرحله ای و بلادرنگ با مدل های پایه است.

ADD از ترکیبی از آموزش خصمانه و تقطیر امتیاز استفاده می کند تا از دانش یک مدل انتشار تصویر از پیش آموزش دیده استفاده کند. مزایای کلیدی نمونه برداری سریع با حفظ وفاداری بالا، توانایی پالایش تکراری، و استفاده از پیش آموزش مدل انتشار پایدار است.

آزمایش های انجام شده توسط محققان نشان می دهد که ADD به طور قابل توجهی از GAN ها، مدل های سازگاری پنهان و سایر روش های تقطیر انتشار در ۱-۴ مرحله بهتر عمل می کند.

مدل SDXL Turbo مطابق با هوش مصنوعی پایدار برای استفاده تجاری آماده نیست، اگرچه در حال حاضر در پیش نمایش این شرکت در دسترس است. وب سرویس کلیپ دراپ.

در آزمایش محدود توسط VentureBeat، تولید تصویر مطمئناً سریع بود، اگرچه نسخه بتا Clipdrop (حداقل در حال حاضر) برخی از گزینه‌های پارامتر پیشرفته‌تر برای تولید تصویر برای سبک‌های مختلف را ندارد. هوش مصنوعی پایداری وزن کد و مدل را نیز در دسترس قرار داده است صورت در آغوش گرفته تحت مجوز تحقیقات غیر تجاری

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.

منبع: https://venturebeat.com/ai/stability-ai-turbocharges-text-to-image-generation-with-sdxl-turbo/

رویداد VB

SDXL – اما سریعتر!

تقطیر انتشار مخالف (ADD) چیست؟

دیدگاهتان را بنویسید لغو پاسخ