VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. شبکه و یادگیری با همتایان صنعت. بیشتر بدانید
میانه سفر یکی از محبوبترین تولیدکنندههای هنر هوش مصنوعی و تولید متن به تصویر است که آثار فوتورئالیستی و سینمایی با کیفیت بالا را از درخواستهای کاربران تایپ شده به زبان انگلیسی ساده که قبلا در تلویزیون زخمی شد و در سینماها (و همچنین در VentureBeat، جایی که ما از آن به همراه سایر ابزارها برای هنر مقاله استفاده می کنیم).
توسط برنامه نویس سابق Magic Leap طراحی شده است دیوید وود و در تابستان ۲۰۲۲ راه اندازی شد، از آن زمان جامعه بیش از ۱۶ میلیون کاربر را در سرور خود در برنامه پیام رسانی جداگانه Discord جذب کرده است و به طور پیوسته توسط تیم کوچکی از برنامه نویسان با ویژگی های جدید به روز شده است. سوژه متحرک، منطقه متفاوت است و یک اپلیکیشن موبایل متمرکز بر انیمیشن.
اما آخرین به روز رسانی آن در شامگاه ۱ نوامبر ۲۰۲۳ راه اندازی شد – به نام تیونر سبک – مسلماً برای شرکتها، برندها و سازندگانی که به دنبال روایت داستانهای منسجم به همان سبک هستند، مهمترین مورد است. دلیل آن این است که تیونر سبک جدید Midjourney به کاربران اجازه می دهد تا سبک بصری منحصر به فرد خود را ایجاد کنند و آن را در هر و به طور بالقوه تمام تصاویر تولید شده در برنامه در آینده اعمال کنند.
قبل از تنظیم سبک، کاربران باید توضیحات متن خود را تکرار میکردند تا سبکهای ثابتی را در چندین تصویر ایجاد کنند – و حتی این تضمینی نبود، زیرا Midjourney، مانند اکثر تولیدکنندگان هنر هوش مصنوعی، برای ارائه انواع بینهایتی از سبکها و انواع تصویر ساخته شده است.
اکنون کاربران می توانند به جای تکیه بر زبان خود، بین انواع سبک ها یکی را انتخاب کنند و کدی را برای اعمال در همه آثار خود در آینده به دست آورند و آنها را در یک خانواده زیبایی شناسی نگه دارند. کاربران Midjourney همچنین میتوانند کد خود را در جای دیگری کپی و جایگذاری کنند تا آن را ذخیره کرده و در آینده به آن ارجاع دهند، یا حتی آن را با سایر کاربران Midjourney در سازمان خود به اشتراک بگذارند تا به آنها اجازه دهند تصاویری به همان سبک تولید کنند. این برای شرکت ها، مارک ها و هر کسی که به دنبال کار روی پروژه های خلاقانه گروهی به سبک یکپارچه است، بسیار بزرگ است. در اینجا نحوه کار آن آمده است:
کجا می توان تیونر سبک Midjourney را پیدا کرد
با رفتن به سرور Midjourney Discord، کاربر می تواند به سادگی “/tune” را تایپ کند و سپس دستور خود را برای شروع فرآیند تنظیم سبک خود تایپ کند.
به عنوان مثال، فرض کنید میخواهم تصاویر پسزمینه وبسایت محصول یا خدماتم را برای زمستان بهروزرسانی کنم تا صحنههای برفی و فضاهای دنج بیشتری را در بر بگیرد.
من میتوانم یک ایده ساده را که دارم تایپ کنم – “روباتی ژاکت دنج میپوشد و جلوی شومینه مینشیند و شکلات داغ مینوشد” – بعد از “/tune”، مانند این: “/ کوک کردن یک روبات یک ژاکت دنج و جلوی شومینه نشسته و در حال نوشیدن شکلات داغ از یک لیوان است.»
ربات Midjourney’s Discord با یک پیام خودکار بزرگ پاسخ می دهد که فرآیند تنظیم سبک را در سطح بالایی توضیح می دهد و از کاربر می پرسد که آیا کاربر می خواهد ادامه دهد یا خیر. فرآیند نیاز به الف دارد طرح اشتراک پولی Midjourney (از ۱۰ دلار در ماه شروع می شود که ماهانه پرداخت می شود یا ۹۶ دلار در سال از قبل) و از برخی از اعتبارات GPU ساعات سریعی که با هر طرح ارائه می شود استفاده می کنند (و بسته به سطح طرح متفاوت است، با برنامه های گران تر که ساعات سریع بیشتری را ارائه می دهند. اعتبار GPU). این امتیازها برای تولید سریعتر تصاویر نسبت به حالت “آرام” استفاده می شود.
انتخاب جهت و حالت سبک و معنای آنها
این پیام شامل دو منوی کشویی است که به کاربر امکان میدهد گزینههای مختلف را انتخاب کند: تعداد «جهتهای سبک» (۱۶، ۳۲، ۶۴ یا ۱۲۸) و «حالت» (پیشفرض یا خام).
تنظیم «جهتهای سبک» نشان میدهد که Midjourney چند تصویر مختلف را از اعلانهای کاربر ایجاد میکند، که هر کدام یک سبک کاملاً متفاوت را نشان میدهند. سپس کاربر این شانس را خواهد داشت که سبک خود را از میان این تصاویر انتخاب کند یا تصاویر به دست آمده را با هم ترکیب کند تا بر اساس چندین مورد از آنها یک متا سبک جدید ایجاد کند.
نکته مهم این است که تعداد متفاوت تصاویر تولید شده توسط گزینههای جهت سبک متفاوت، هرکدام هزینههای متفاوتی از اعتبار GPU ساعتهای سریع دارند. به عنوان مثال، ۱۶ جهت سبک ۰٫۱۵ ساعت سریع از اعتبار GPU را مصرف می کنند، در حالی که ۱۲۸ جهت سبک از ۱٫۲ اعتبار استفاده می کنند. بنابراین کاربر باید به سختی و با دقت فکر کند که چه تعداد سبک مختلف را میخواهد تولید کند و آیا میخواهد همه آن اعتبارات را خرج کند یا خیر.
در همین حال، تنظیم “حالت” باینری است و به کاربر امکان می دهد بین پیش فرض یا خام یکی را انتخاب کند و به میزان صریح و دانه دار بودن عکس ها اشاره کند. تصاویر خام بیشتر شبیه یک فیلم یا دوربین DLSR هستند و به همین دلیل ممکن است واقعی تر باشند، اما همچنین حاوی مصنوعاتی هستند که حالت پیش فرض، ضدعفونی شده و صاف وجود ندارد.
در بررسی ما برای این مقاله، VentureBeat 16 جهت سبک و حالت پیش فرض را انتخاب کرد. در آزمایشهای ما، و آنهایی که توسط چندین کاربر آنلاین گزارش شدهاند، Midjourney به اشتباه به کاربران یک سطح بیشتر از جهتهای سبک بیشتر از درخواست آنها میدهد – بنابراین در مورد ما، با وجود اینکه ۱۶ درخواست کردیم، ۳۲ دریافت کردیم.
پس از انتخاب حالت و جهتهای سبک، ربات Midjourney از شما میپرسد که آیا مطمئن هستید که میخواهید ادامه دهید یا خیر و دوباره به شما نشان میدهد که چند اعتبار مصرف میکنید، و اگر دکمه سبز را فشار دهید، میتوانید ادامه دهید. این فرآیند می تواند تا ۲ دقیقه طول بکشد.
از کجا می توان سبک های مختلف را برای انتخاب پیدا کرد
پس از اینکه Midjourney پردازش گزینههای تیونر سبک شما را به پایان رساند، ربات باید با پیامی با عنوان «Style Tuner Ready!» پاسخ دهد. تولید تیونر سبک سفارشی شما به پایان رسیده است. اکنون میتوانید در اینجا استایلها را مشاهده، اشتراکگذاری و ایجاد کنید:» و سپس یک URL به وبسایت Midjourney Tuner (دامنه tuner.midjourney.com است).
URL حاصل باید شامل یک رشته تصادفی از حروف و اعداد در پایان باشد. ما برای اهداف امنیتی در تصویر زیر، مال خود را حذف کردهایم.
کلیک کردن روی URL کاربر را از برنامه Discord خارج کرده و به وب سایت Midjourney در مرورگر شما می برد.
در آنجا، کاربر یک پیام سفارشی شده و در عین حال پیشفرض از Midjourney خواهد دید که زبان سریع کاربر را نشان میدهد و توضیح میدهد که چگونه فرآیند تنظیم را به پایان برساند. یعنی، Midjourney از کاربر میخواهد که بین دو گزینه مختلف با دکمههای برچسبگذاری شده انتخاب کند: «دو سبک را در یک زمان مقایسه کنید» یا «مورد علاقه خود را از یک شبکه بزرگ انتخاب کنید».
در وهله اول، “مقایسه دو سبک در یک زمان” Midjourney شبکه حاصل از هر تعداد تصویری را که قبلاً انتخاب کرده اید در گزینه جهت های سبک در Discord در ردیف های دوتایی نمایش می دهد. در مورد ما، این ۱۶ ردیف است. با این حال، هر ردیف شامل دو شبکه تصویر ۴×۴ است، بنابراین ۸ تصویر در هر ردیف.
سپس کاربر میتواند از هر ردیف یک شبکه ۴×۴ از هر ردیفی که میخواهد انتخاب کند، و Midjourney سبکی را ایجاد میکند که از ترکیب آن شبکهها مطلع میشود. با طرح سفیدی که در اطراف آن ظاهر می شود، می توانید تشخیص دهید که کدام شبکه انتخاب شده است.
بنابراین، اگر من تصویر سمت راست را از ردیف اول و تصویر سمت چپ را از ردیف پایین انتخاب کنم، Midjourney هر دو سبک تصویر را در یک سبک ترکیبی اعمال میکند و کاربر میتواند آن سبک ترکیبی را برای همه تصاویری که در حال رفتن هستند اعمال کند. رو به جلو. همانطور که Midjourney در پایین این صفحه انتخاب اشاره میکند، انتخاب گزینههای بیشتر از هر ردیف منجر به یک سبک “مشخص و تراز” میشود در حالی که انتخاب تنها چند گزینه منجر به یک “سبک پررنگ” میشود.
گزینه دوم، «مورد دلخواه خود را از یک شبکه بزرگ انتخاب کنید»، به کاربر این امکان را می دهد که تنها یک تصویر از کل شبکه تمام تصاویر تولید شده از آنها را با توجه به تعداد جهت های سبکی که کاربر قبلاً تنظیم کرده است انتخاب کند. در مورد ما برای این مقاله، این در مجموع ۳۲ تصویر است که در یک شبکه ۸×۴ مرتب شده اند. این گزینه از گزینه “مقایسه دو سبک” دقیق تر و کمتر مبهم است، اما در نتیجه محدودتر است.
در مورد ما، برای این مقاله، “مقایسه دو سبک در یک زمان” را انتخاب می کنیم، در مجموع ۵ شبکه را انتخاب می کنیم و آن را به الگوریتم ها واگذار می کنیم تا تصمیم بگیرند که سبک ترکیبی چگونه به نظر می رسد.
به کار بردن سبک تازه تنظیم شده خود برای مشاهده تصاویر و درخواست های جدید
هر تعداد ردیف یا تصویری که کاربر برای استایل خود انتخاب کند، Midjourney به طور خودکار آن سبک را اعمال میکند و آن را به کد کوتاهی از اعداد و حروف تبدیل میکند که کاربر میتواند بهصورت دستی برای همه درخواستهای بعدی کپی و جایگذاری کند. آن کد کوتاه در چندین مکان در پایین صفحه منحصر به فرد Style Tuner کاربر ظاهر می شود، هر دو در بخشی با علامت “کد شما این است:” و سپس کد، و سپس در یک درخواست نمونه بر اساس نسخه اصلی که کاربر در همان صفحه ارائه کرده است. پایین در یک عنصر chyron روکش پایدار.
سپس کاربر می تواند این کد را کپی کرده و در جایی ذخیره کند، یا کل درخواست اصلی خود را با کد اضافه شده از پایین چیرون کپی کند. همچنین میتوانید کل این سبک را با فشار دادن نماد کوچک «رفرش» در پایین (فلشهای دایرهای) دوباره انجام دهید.
سپس، کاربر باید به سرور Midjourney Discord برگردد و کد را پس از درخواست خود به صورت زیر بچسباند: “تصور کنید/ یک ربات یک ژاکت دنج می پوشد و در مقابل یک شومینه می نشیند و در حال نوشیدن شکلات داغ از یک لیوان است. [INSERT STYLE CODE HERE]”
در اینجا شبکه حاصل از تصاویر ۴×۴ با استفاده از دستور اصلی و سبک تازه تولید شده ما آمده است:
ما چهارمین مورد را بیشتر دوست داریم، بنابراین با کلیک کردن بر روی “U4” و voila آن را برای ارتقاء سطح بالا انتخاب می کنیم، ربات دنج ما در حال نوشیدن شکلات داغ کنار شومینه است!
حالا بیایید همان سبک را با کپی و چسباندن/اضافه کردن دستی زبان “-style” به انتهای دستور جدیدمان، مانند: “یک خانواده ربات، presents –style را باز میکند، به یک دستور جدید اعمال کنیم. [INSERT STYLE CODE HERE]نتیجه این است (پس از انتخاب یکی از شبکه ۴×۴ ما):
بد نیست! توجه داشته باشید که این پس از چند بار بازسازی است. کد سبک همچنین در کنار پارامترهای دیگر در فرمان شما، از جمله نسبت ابعاد/ابعاد، کار می کند. در اینجا یک نسخه ۱۶:۹ با استفاده از همان دستور وجود دارد، اما به این صورت نوشته شده است: “یک خانواده ربات به سبک -ar 16:9 باز می کند. [INSERT STYLE CODE HERE]”
ناز اما کمی بداخلاق ممکن است پیشنهاد کنیم که به اصلاح این یکی ادامه دهید.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/midjourneys-new-style-tuner-is-here-heres-how-to-use-it/