تیونر سبک جدید Midjourney اینجاست. در اینجا نحوه استفاده از آن آورده شده است.

مرد جوانی که عینک آفتابی با عدسی‌های نارنجی نئون و ژاکت جین آبی روی پیراهن سفید دارد، لپ‌تاپ را در مقابل پس‌زمینه نئونی چند ضلعی رنگارنگ می‌نویسد.

VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. شبکه و یادگیری با همتایان صنعت. بیشتر بدانید


میانه سفر یکی از محبوب‌ترین تولیدکننده‌های هنر هوش مصنوعی و تولید متن به تصویر است که آثار فوتورئالیستی و سینمایی با کیفیت بالا را از درخواست‌های کاربران تایپ شده به زبان انگلیسی ساده که قبلا در تلویزیون زخمی شد و در سینماها (و همچنین در VentureBeat، جایی که ما از آن به همراه سایر ابزارها برای هنر مقاله استفاده می کنیم).

توسط برنامه نویس سابق Magic Leap طراحی شده است دیوید وود و در تابستان ۲۰۲۲ راه اندازی شد، از آن زمان جامعه بیش از ۱۶ میلیون کاربر را در سرور خود در برنامه پیام رسانی جداگانه Discord جذب کرده است و به طور پیوسته توسط تیم کوچکی از برنامه نویسان با ویژگی های جدید به روز شده است. سوژه متحرک، منطقه متفاوت است و یک اپلیکیشن موبایل متمرکز بر انیمیشن.

اما آخرین به روز رسانی آن در شامگاه ۱ نوامبر ۲۰۲۳ راه اندازی شد – به نام تیونر سبک – مسلماً برای شرکت‌ها، برندها و سازندگانی که به دنبال روایت داستان‌های منسجم به همان سبک هستند، مهم‌ترین مورد است. دلیل آن این است که تیونر سبک جدید Midjourney به کاربران اجازه می دهد تا سبک بصری منحصر به فرد خود را ایجاد کنند و آن را در هر و به طور بالقوه تمام تصاویر تولید شده در برنامه در آینده اعمال کنند.

قبل از تنظیم سبک، کاربران باید توضیحات متن خود را تکرار می‌کردند تا سبک‌های ثابتی را در چندین تصویر ایجاد کنند – و حتی این تضمینی نبود، زیرا Midjourney، مانند اکثر تولیدکنندگان هنر هوش مصنوعی، برای ارائه انواع بی‌نهایتی از سبک‌ها و انواع تصویر ساخته شده است.

رویداد

هوش مصنوعی آزاد شد

یک شب انحصاری فقط دعوت از بینش و شبکه، که برای مدیران ارشد سازمانی که بر پشته‌های داده و استراتژی‌ها نظارت دارند، طراحی شده است.

بیشتر بدانید

اکنون کاربران می توانند به جای تکیه بر زبان خود، بین انواع سبک ها یکی را انتخاب کنند و کدی را برای اعمال در همه آثار خود در آینده به دست آورند و آنها را در یک خانواده زیبایی شناسی نگه دارند. کاربران Midjourney همچنین می‌توانند کد خود را در جای دیگری کپی و جای‌گذاری کنند تا آن را ذخیره کرده و در آینده به آن ارجاع دهند، یا حتی آن را با سایر کاربران Midjourney در سازمان خود به اشتراک بگذارند تا به آنها اجازه دهند تصاویری به همان سبک تولید کنند. این برای شرکت ها، مارک ها و هر کسی که به دنبال کار روی پروژه های خلاقانه گروهی به سبک یکپارچه است، بسیار بزرگ است. در اینجا نحوه کار آن آمده است:

کجا می توان تیونر سبک Midjourney را پیدا کرد

با رفتن به سرور Midjourney Discord، کاربر می تواند به سادگی “/tune” را تایپ کند و سپس دستور خود را برای شروع فرآیند تنظیم سبک خود تایپ کند.

به عنوان مثال، فرض کنید می‌خواهم تصاویر پس‌زمینه وب‌سایت محصول یا خدماتم را برای زمستان به‌روزرسانی کنم تا صحنه‌های برفی و فضاهای دنج بیشتری را در بر بگیرد.

من می‌توانم یک ایده ساده را که دارم تایپ کنم – “روباتی ژاکت دنج می‌پوشد و جلوی شومینه می‌نشیند و شکلات داغ می‌نوشد” – بعد از “/tune”، مانند این: “/ کوک کردن یک روبات یک ژاکت دنج و جلوی شومینه نشسته و در حال نوشیدن شکلات داغ از یک لیوان است.»

ربات Midjourney’s Discord با یک پیام خودکار بزرگ پاسخ می دهد که فرآیند تنظیم سبک را در سطح بالایی توضیح می دهد و از کاربر می پرسد که آیا کاربر می خواهد ادامه دهد یا خیر. فرآیند نیاز به الف دارد طرح اشتراک پولی Midjourney (از ۱۰ دلار در ماه شروع می شود که ماهانه پرداخت می شود یا ۹۶ دلار در سال از قبل) و از برخی از اعتبارات GPU ساعات سریعی که با هر طرح ارائه می شود استفاده می کنند (و بسته به سطح طرح متفاوت است، با برنامه های گران تر که ساعات سریع بیشتری را ارائه می دهند. اعتبار GPU). این امتیازها برای تولید سریعتر تصاویر نسبت به حالت “آرام” استفاده می شود.

انتخاب جهت و حالت سبک و معنای آنها

این پیام شامل دو منوی کشویی است که به کاربر امکان می‌دهد گزینه‌های مختلف را انتخاب کند: تعداد «جهت‌های سبک» (۱۶، ۳۲، ۶۴ یا ۱۲۸) و «حالت» (پیش‌فرض یا خام).

تنظیم «جهت‌های سبک» نشان می‌دهد که Midjourney چند تصویر مختلف را از اعلان‌های کاربر ایجاد می‌کند، که هر کدام یک سبک کاملاً متفاوت را نشان می‌دهند. سپس کاربر این شانس را خواهد داشت که سبک خود را از میان این تصاویر انتخاب کند یا تصاویر به دست آمده را با هم ترکیب کند تا بر اساس چندین مورد از آنها یک متا سبک جدید ایجاد کند.

نکته مهم این است که تعداد متفاوت تصاویر تولید شده توسط گزینه‌های جهت سبک متفاوت، هرکدام هزینه‌های متفاوتی از اعتبار GPU ساعت‌های سریع دارند. به عنوان مثال، ۱۶ جهت سبک ۰٫۱۵ ساعت سریع از اعتبار GPU را مصرف می کنند، در حالی که ۱۲۸ جهت سبک از ۱٫۲ اعتبار استفاده می کنند. بنابراین کاربر باید به سختی و با دقت فکر کند که چه تعداد سبک مختلف را می‌خواهد تولید کند و آیا می‌خواهد همه آن اعتبارات را خرج کند یا خیر.

در همین حال، تنظیم “حالت” باینری است و به کاربر امکان می دهد بین پیش فرض یا خام یکی را انتخاب کند و به میزان صریح و دانه دار بودن عکس ها اشاره کند. تصاویر خام بیشتر شبیه یک فیلم یا دوربین DLSR هستند و به همین دلیل ممکن است واقعی تر باشند، اما همچنین حاوی مصنوعاتی هستند که حالت پیش فرض، ضدعفونی شده و صاف وجود ندارد.

در بررسی ما برای این مقاله، VentureBeat 16 جهت سبک و حالت پیش فرض را انتخاب کرد. در آزمایش‌های ما، و آن‌هایی که توسط چندین کاربر آنلاین گزارش شده‌اند، Midjourney به اشتباه به کاربران یک سطح بیشتر از جهت‌های سبک بیشتر از درخواست آنها می‌دهد – بنابراین در مورد ما، با وجود اینکه ۱۶ درخواست کردیم، ۳۲ دریافت کردیم.

پس از انتخاب حالت و جهت‌های سبک، ربات Midjourney از شما می‌پرسد که آیا مطمئن هستید که می‌خواهید ادامه دهید یا خیر و دوباره به شما نشان می‌دهد که چند اعتبار مصرف می‌کنید، و اگر دکمه سبز را فشار دهید، می‌توانید ادامه دهید. این فرآیند می تواند تا ۲ دقیقه طول بکشد.

از کجا می توان سبک های مختلف را برای انتخاب پیدا کرد

پس از اینکه Midjourney پردازش گزینه‌های تیونر سبک شما را به پایان رساند، ربات باید با پیامی با عنوان «Style Tuner Ready!» پاسخ دهد. تولید تیونر سبک سفارشی شما به پایان رسیده است. اکنون می‌توانید در اینجا استایل‌ها را مشاهده، اشتراک‌گذاری و ایجاد کنید:» و سپس یک URL به وب‌سایت Midjourney Tuner (دامنه tuner.midjourney.com است).

URL حاصل باید شامل یک رشته تصادفی از حروف و اعداد در پایان باشد. ما برای اهداف امنیتی در تصویر زیر، مال خود را حذف کرده‌ایم.

کلیک کردن روی URL کاربر را از برنامه Discord خارج کرده و به وب سایت Midjourney در مرورگر شما می برد.

در آنجا، کاربر یک پیام سفارشی شده و در عین حال پیش‌فرض از Midjourney خواهد دید که زبان سریع کاربر را نشان می‌دهد و توضیح می‌دهد که چگونه فرآیند تنظیم را به پایان برساند. یعنی، Midjourney از کاربر می‌خواهد که بین دو گزینه مختلف با دکمه‌های برچسب‌گذاری شده انتخاب کند: «دو سبک را در یک زمان مقایسه کنید» یا «مورد علاقه خود را از یک شبکه بزرگ انتخاب کنید».

در وهله اول، “مقایسه دو سبک در یک زمان” Midjourney شبکه حاصل از هر تعداد تصویری را که قبلاً انتخاب کرده اید در گزینه جهت های سبک در Discord در ردیف های دوتایی نمایش می دهد. در مورد ما، این ۱۶ ردیف است. با این حال، هر ردیف شامل دو شبکه تصویر ۴×۴ است، بنابراین ۸ تصویر در هر ردیف.

سپس کاربر می‌تواند از هر ردیف یک شبکه ۴×۴ از هر ردیفی که می‌خواهد انتخاب کند، و Midjourney سبکی را ایجاد می‌کند که از ترکیب آن شبکه‌ها مطلع می‌شود. با طرح سفیدی که در اطراف آن ظاهر می شود، می توانید تشخیص دهید که کدام شبکه انتخاب شده است.

بنابراین، اگر من تصویر سمت راست را از ردیف اول و تصویر سمت چپ را از ردیف پایین انتخاب کنم، Midjourney هر دو سبک تصویر را در یک سبک ترکیبی اعمال می‌کند و کاربر می‌تواند آن سبک ترکیبی را برای همه تصاویری که در حال رفتن هستند اعمال کند. رو به جلو. همانطور که Midjourney در پایین این صفحه انتخاب اشاره می‌کند، انتخاب گزینه‌های بیشتر از هر ردیف منجر به یک سبک “مشخص و تراز” می‌شود در حالی که انتخاب تنها چند گزینه منجر به یک “سبک پررنگ” می‌شود.

گزینه دوم، «مورد دلخواه خود را از یک شبکه بزرگ انتخاب کنید»، به کاربر این امکان را می دهد که تنها یک تصویر از کل شبکه تمام تصاویر تولید شده از آنها را با توجه به تعداد جهت های سبکی که کاربر قبلاً تنظیم کرده است انتخاب کند. در مورد ما برای این مقاله، این در مجموع ۳۲ تصویر است که در یک شبکه ۸×۴ مرتب شده اند. این گزینه از گزینه “مقایسه دو سبک” دقیق تر و کمتر مبهم است، اما در نتیجه محدودتر است.

در مورد ما، برای این مقاله، “مقایسه دو سبک در یک زمان” را انتخاب می کنیم، در مجموع ۵ شبکه را انتخاب می کنیم و آن را به الگوریتم ها واگذار می کنیم تا تصمیم بگیرند که سبک ترکیبی چگونه به نظر می رسد.

به کار بردن سبک تازه تنظیم شده خود برای مشاهده تصاویر و درخواست های جدید

هر تعداد ردیف یا تصویری که کاربر برای استایل خود انتخاب کند، Midjourney به طور خودکار آن سبک را اعمال می‌کند و آن را به کد کوتاهی از اعداد و حروف تبدیل می‌کند که کاربر می‌تواند به‌صورت دستی برای همه درخواست‌های بعدی کپی و جای‌گذاری کند. آن کد کوتاه در چندین مکان در پایین صفحه منحصر به فرد Style Tuner کاربر ظاهر می شود، هر دو در بخشی با علامت “کد شما این است:” و سپس کد، و سپس در یک درخواست نمونه بر اساس نسخه اصلی که کاربر در همان صفحه ارائه کرده است. پایین در یک عنصر chyron روکش پایدار.

سپس کاربر می تواند این کد را کپی کرده و در جایی ذخیره کند، یا کل درخواست اصلی خود را با کد اضافه شده از پایین چیرون کپی کند. همچنین می‌توانید کل این سبک را با فشار دادن نماد کوچک «رفرش» در پایین (فلش‌های دایره‌ای) دوباره انجام دهید.

سپس، کاربر باید به سرور Midjourney Discord برگردد و کد را پس از درخواست خود به صورت زیر بچسباند: “تصور کنید/ یک ربات یک ژاکت دنج می پوشد و در مقابل یک شومینه می نشیند و در حال نوشیدن شکلات داغ از یک لیوان است. [INSERT STYLE CODE HERE]”

در اینجا شبکه حاصل از تصاویر ۴×۴ با استفاده از دستور اصلی و سبک تازه تولید شده ما آمده است:

ما چهارمین مورد را بیشتر دوست داریم، بنابراین با کلیک کردن بر روی “U4” و voila آن را برای ارتقاء سطح بالا انتخاب می کنیم، ربات دنج ما در حال نوشیدن شکلات داغ کنار شومینه است!

حالا بیایید همان سبک را با کپی و چسباندن/اضافه کردن دستی زبان “-style” به انتهای دستور جدیدمان، مانند: “یک خانواده ربات، presents –style را باز می‌کند، به یک دستور جدید اعمال کنیم. [INSERT STYLE CODE HERE]نتیجه این است (پس از انتخاب یکی از شبکه ۴×۴ ما):

بد نیست! توجه داشته باشید که این پس از چند بار بازسازی است. کد سبک همچنین در کنار پارامترهای دیگر در فرمان شما، از جمله نسبت ابعاد/ابعاد، کار می کند. در اینجا یک نسخه ۱۶:۹ با استفاده از همان دستور وجود دارد، اما به این صورت نوشته شده است: “یک خانواده ربات به سبک -ar 16:9 باز می کند. [INSERT STYLE CODE HERE]”

ناز اما کمی بداخلاق ممکن است پیشنهاد کنیم که به اصلاح این یکی ادامه دهید.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/midjourneys-new-style-tuner-is-here-heres-how-to-use-it/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *