در اقدامی پیشگامانه، خدمات وب آمازون (AWS) از راه اندازی مولد تصویر آمازون تایتان در روز چهارشنبه خبر داد و در کنار رقبای صنعتی مایکروسافت، استیبل دیفیوژن، Midjourney و Adobe وارد عرصه رقابت شد.
به گفته این شرکت، ابزار نوآورانه جدید به کاربران اجازه می دهد تا نه تنها تصاویر جدیدی از توضیحات متن تولید کنند، بلکه تصاویر موجود را با استفاده از متن اصلاح کنند و به تولیدکنندگان محتوا ابزاری سریع و دقیق برای اصلاح تصاویر بر اساس نشانه های زبان انگلیسی ارائه کنند.
در کنفرانس AWS ‘re:Invent 2023’، سوامی سیواسوبرامانیان، معاون پایگاه داده، تجزیه و تحلیل و یادگیری ماشین، قابلیتهای ژنراتور را به نمایش گذاشت.
سیواسوبرامانیان بر نقش آن در تسهیل تعویض آسان پسزمینه، تبدیل صحنهها بهطور یکپارچه با حفظ تمرکز اصلی تصویر و گسترش امکانات خلاقانه تأکید کرد.
Titan Image Generator نوید بزرگی برای مشاغل در زمینه تبلیغات، تجارت الکترونیک، رسانه و سرگرمی دارد و تصاویری با حجم بالا، مقرون به صرفه و با کیفیت استودیویی را ارائه می دهد. این مدل درک دستورالعملهای پیچیده شامل عناصر متعدد را نشان میدهد و تصاویر مرتبط با زمینه را تولید میکند.
این مدل که بر روی دادههای متنوع و با کیفیت بالا آموزش دیده است، دقت، تولید تصاویر واقعی و در عین حال اولویت بخشیدن به فراگیری و به حداقل رساندن اعوجاج را هدف قرار داده است.
AWS پتانسیل سفارشیسازی Titan Image Generator را برجسته میکند و به شرکتها این امکان را میدهد که مدل را با دادههای اختصاصی تنظیم کنند تا با دستورالعملهای برند هماهنگ شوند یا تصاویری به سبک خاصی ایجاد کنند، مانند ابزارسازی مجدد مدل با تصاویر کمپین بازاریابی قبلی.
Titan Image Generator همچنین با کاهش تولید محتوای مضر، استفاده مسئولانه از هوش مصنوعی را تضمین می کند.
تمام تصاویر تولید شده توسط آمازون تایتان دارای یک واترمارک نامرئی هستند، یک ویژگی پیش فرض که به شناسایی محتاطانه تصاویر تولید شده توسط هوش مصنوعی برای جلوگیری از انتشار اطلاعات نادرست کمک می کند.
AWS دو مدل جدید پایه چندوجهی آمازون تایتان را همراه با آمازون تایتان چندوجهی Embeddings معرفی کرد که طیف وسیعی از گزینههای با کارایی بالا را برای مدلهای تصویر، چندوجهی و متن از طریق یک API کاملاً مدیریت شده ارائه میکند.
علاوه بر این، AWS از ادغام مدل پایه آنتروپیک کلود ۲٫۱ (FM) در بستر آمازون خبر داد که باعث افزایش دقت و کاهش نرخ توهم، به ویژه در اسناد طولانی و درخواستهای سیستمی میشود. یک ویژگی ابزار بتا برای فراخوانی تابع و هماهنگسازی گردش کار نیز معرفی شد.
مرکز نوآوری AWS Generative AI از زمان راهاندازی در ژوئن ۲۰۲۳، با مشتریان جهانی متعددی از جمله استراتژیستها، دانشمندان داده، مهندسان ML و معماران راهحل همکاری کرده است.
این تیم نقش مهمی در مفهومسازی، اولویتبندی و ساخت راهحلهای متناسب با استفاده از هوش مصنوعی مولد ایفا کرده است.
AWS از برنامه مدل سفارشی مرکز نوآوری هوش مصنوعی AWS Generative AWS برای Anthropic Claude رونمایی کرد. از سه ماهه اول ۲۰۲۴، مشتریان میتوانند با محققان و دانشمندان ML از مرکز همکاری کنند تا مدلهای Anthropic Claude را با استفاده از دادههای اختصاصی خود بهطور ایمن تنظیم کنند.
(با ورودی های نمایندگی ها)
منبع: https://www.firstpost.com/tech/amazon-takes-on-adobe-stable-diffusion-midjourney-releases-its-own-ai-powered-image-generator-13449412.html