آمازون با Adobe، Stable Diffusion، Midjourney مقابله می کند و تولید کننده تصویر خود را با هوش مصنوعی منتشر می کند.

در اقدامی پیشگامانه، خدمات وب آمازون (AWS) از راه اندازی مولد تصویر آمازون تایتان در روز چهارشنبه خبر داد و در کنار رقبای صنعتی مایکروسافت، استیبل دیفیوژن، Midjourney و Adobe وارد عرصه رقابت شد.

به گفته این شرکت، ابزار نوآورانه جدید به کاربران اجازه می دهد تا نه تنها تصاویر جدیدی از توضیحات متن تولید کنند، بلکه تصاویر موجود را با استفاده از متن اصلاح کنند و به تولیدکنندگان محتوا ابزاری سریع و دقیق برای اصلاح تصاویر بر اساس نشانه های زبان انگلیسی ارائه کنند.

در کنفرانس AWS ‘re:Invent 2023’، سوامی سیواسوبرامانیان، معاون پایگاه داده، تجزیه و تحلیل و یادگیری ماشین، قابلیت‌های ژنراتور را به نمایش گذاشت.

سیواسوبرامانیان بر نقش آن در تسهیل تعویض آسان پس‌زمینه، تبدیل صحنه‌ها به‌طور یکپارچه با حفظ تمرکز اصلی تصویر و گسترش امکانات خلاقانه تأکید کرد.

Titan Image Generator نوید بزرگی برای مشاغل در زمینه تبلیغات، تجارت الکترونیک، رسانه و سرگرمی دارد و تصاویری با حجم بالا، مقرون به صرفه و با کیفیت استودیویی را ارائه می دهد. این مدل درک دستورالعمل‌های پیچیده شامل عناصر متعدد را نشان می‌دهد و تصاویر مرتبط با زمینه را تولید می‌کند.

این مدل که بر روی داده‌های متنوع و با کیفیت بالا آموزش دیده است، دقت، تولید تصاویر واقعی و در عین حال اولویت بخشیدن به فراگیری و به حداقل رساندن اعوجاج را هدف قرار داده است.

AWS پتانسیل سفارشی‌سازی Titan Image Generator را برجسته می‌کند و به شرکت‌ها این امکان را می‌دهد که مدل را با داده‌های اختصاصی تنظیم کنند تا با دستورالعمل‌های برند هماهنگ شوند یا تصاویری به سبک خاصی ایجاد کنند، مانند ابزارسازی مجدد مدل با تصاویر کمپین بازاریابی قبلی.

Titan Image Generator همچنین با کاهش تولید محتوای مضر، استفاده مسئولانه از هوش مصنوعی را تضمین می کند.

تمام تصاویر تولید شده توسط آمازون تایتان دارای یک واترمارک نامرئی هستند، یک ویژگی پیش فرض که به شناسایی محتاطانه تصاویر تولید شده توسط هوش مصنوعی برای جلوگیری از انتشار اطلاعات نادرست کمک می کند.

AWS دو مدل جدید پایه چندوجهی آمازون تایتان را همراه با آمازون تایتان چندوجهی Embeddings معرفی کرد که طیف وسیعی از گزینه‌های با کارایی بالا را برای مدل‌های تصویر، چندوجهی و متن از طریق یک API کاملاً مدیریت شده ارائه می‌کند.

علاوه بر این، AWS از ادغام مدل پایه آنتروپیک کلود ۲٫۱ (FM) در بستر آمازون خبر داد که باعث افزایش دقت و کاهش نرخ توهم، به ویژه در اسناد طولانی و درخواست‌های سیستمی می‌شود. یک ویژگی ابزار بتا برای فراخوانی تابع و هماهنگ‌سازی گردش کار نیز معرفی شد.

مرکز نوآوری AWS Generative AI از زمان راه‌اندازی در ژوئن ۲۰۲۳، با مشتریان جهانی متعددی از جمله استراتژیست‌ها، دانشمندان داده، مهندسان ML و معماران راه‌حل همکاری کرده است.

این تیم نقش مهمی در مفهوم‌سازی، اولویت‌بندی و ساخت راه‌حل‌های متناسب با استفاده از هوش مصنوعی مولد ایفا کرده است.

AWS از برنامه مدل سفارشی مرکز نوآوری هوش مصنوعی AWS Generative AWS برای Anthropic Claude رونمایی کرد. از سه ماهه اول ۲۰۲۴، مشتریان می‌توانند با محققان و دانشمندان ML از مرکز همکاری کنند تا مدل‌های Anthropic Claude را با استفاده از داده‌های اختصاصی خود به‌طور ایمن تنظیم کنند.

(با ورودی های نمایندگی ها)

منبع: https://www.firstpost.com/tech/amazon-takes-on-adobe-stable-diffusion-midjourney-releases-its-own-ai-powered-image-generator-13449412.html

دیدگاهتان را بنویسید لغو پاسخ