آخرین تحقیقات هوش مصنوعی اپل می تواند آیفون شما را کاملا متحول کند

آخرین تحقیقات هوش مصنوعی اپل می تواند آیفون شما را کاملا متحول کند

آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.


سیبشرکتی که عملاً مترادف با نوآوری فناوری است، بار دیگر خود را در خط مقدم انقلاب هوش مصنوعی قرار داده است.

این شرکت مستقر در کوپرتینو، کالیفرنیا، اخیراً از طریق دو مقاله جدید که تکنیک‌های جدیدی را برای آواتارهای سه بعدی و استنتاج مدل زبانی کارآمد معرفی می‌کند، گام‌های مهمی را در تحقیقات هوش مصنوعی اعلام کرده است. این پیشرفت‌ها می‌توانند تجربه‌های بصری همهجانبه‌تری را ایجاد کنند و به سیستم‌های پیچیده هوش مصنوعی اجازه دهند روی دستگاه‌های مصرف‌کننده مانند آیفون و آی‌پد اجرا شوند.

در اولین مقاله تحقیقاتیدانشمندان اپل پیشنهاد می کنند آغوش (Human Gaussian Splats) برای تولید آواتارهای سه بعدی متحرک از ویدیوهای کوتاه تک چشمی (یعنی فیلم های گرفته شده از یک دوربین). محمد کوکاباس، نویسنده اصلی این مقاله گفت: روش ما فقط یک ویدیوی تک چشمی با تعداد کمی فریم (۵۰ تا ۱۰۰) می گیرد و به طور خودکار می آموزد که صحنه ایستا و یک آواتار انسانی کاملاً متحرک را در عرض ۳۰ دقیقه از هم جدا کند.

ویدیوی آموزشی (بالا سمت چپ)، آواتار انسانی متعارف بازسازی شده (بالا سمت راست)، مدل صحنه بازسازی شده (پایین سمت چپ)، و انسان متحرک به همراه صحنه (پایین سمت راست). (اعتبار: اپل)

HUGS هم صحنه انسان و هم صحنه پس زمینه را با استفاده از پاشیدن گاوسی سه بعدی، یک تکنیک رندر کارآمد، نشان می دهد. مدل انسان از یک مدل آماری شکل بدن به نام مقداردهی اولیه شده است SMPL. اما HUGS به گاوسیان اجازه انحراف را می دهد و امکان ثبت جزئیاتی مانند لباس و مو را فراهم می کند.

رویداد VB

تور AI Impact Tour

در تور AI Impact VentureBeat که به شهر نزدیک شما می آید، با جامعه هوش مصنوعی سازمانی ارتباط برقرار کنید!

بیشتر بدانید

رمان ماژول تغییر شکل عصبی گاوسی ها را به شیوه ای واقع گرایانه با استفاده از لایه برداری ترکیبی خطی متحرک می کند. این حرکت هماهنگ در حین قرار دادن آواتار از مصنوعات جلوگیری می کند. به گفته کوکاباس، HUGS “ترکیب ژست بدیع انسان و ترکیب نمای بدیع انسان و صحنه را ممکن می کند.”

در مقایسه با روش‌های قبلی تولید آواتار، HUGS در آموزش و رندر تا ۱۰۰ برابر سریع‌تر است. محققان پس از بهینه سازی سیستم به مدت ۳۰ دقیقه روی یک GPU معمولی بازی، نتایج واقعی واقعی را نشان می دهند. HUGS همچنین از تکنیک های پیشرفته ای مانند عملکرد بهتر عمل می کند Vid2Avatar و NeuMan در کیفیت بازسازی سه بعدی

فناوری جدید به افراد اجازه می‌دهد شخصیت‌های دیجیتال مختلف یا «آواتارها» را با استفاده از تنها یک ویدیو از شخص و مکان در صحنه‌ای جدید قرار دهند. این را می توان به سرعت انجام داد، با به روز رسانی تصویر ۶۰ بار در هر ثانیه تا صاف و واقعی به نظر برسد. (اعتبار: اپل)

قابلیت جدید مدل سازی سه بعدی یک دستاورد واقعا چشمگیر از سوی محققان اپل است. عملکرد بلادرنگ و توانایی ایجاد آواتار از ویدیوهای درون وحشی می‌تواند در آینده نسبتاً نزدیک امکانات جدیدی را برای آزمایش مجازی، حضور از راه دور و رسانه‌های مصنوعی باز کند. اگر بتوانید صحنه های سه بعدی جدیدی مانند این را درست بر روی دوربین آیفون خود ایجاد کنید، امکانات را تصور کنید!

پر کردن شکاف حافظه در استنتاج هوش مصنوعی

در کاغذ دوممحققان اپل با یک چالش کلیدی در استقرار مدل‌های زبان بزرگ (LLM) در دستگاه‌هایی با حافظه محدود مقابله کردند. مدل‌های مدرن زبان طبیعی مانند GPT-4 حاوی صدها میلیارد پارامتر هستند که استنتاج را روی سخت‌افزار مصرف‌کننده گران می‌کند.

سیستم پیشنهادی انتقال داده از حافظه فلش به DRAM کمیاب را در طول استنتاج به حداقل می رساند. کیوان علیزاده، نویسنده اصلی این مقاله توضیح داد: “روش ما شامل ساخت یک مدل هزینه استنتاج است که با رفتار حافظه فلش هماهنگ است، و ما را برای بهینه سازی در دو حوزه مهم راهنمایی می کند: کاهش حجم داده های منتقل شده از فلش و خواندن داده ها در قطعات بزرگتر و پیوسته تر.” . .

دو تکنیک اصلی معرفی شده است. “پنجره“فعال‌سازی‌های حاصل از استنتاج‌های اخیر را مجدداً استفاده می‌کند، در حالی که”دسته بندی ردیف-ستون“با ذخیره سطرها و ستون‌ها در کنار هم، بلوک‌های بزرگ‌تری از داده‌ها را می‌خواند. در CPU Apple M1 Max، این روش‌ها تاخیر استنتاج را ۴-۵ برابر در مقایسه با بارگذاری ساده بهبود می‌بخشند. در یک GPU، سرعت افزایش به ۲۰-۲۵ برابر می‌رسد.

مهرداد فرجتبار یکی از نویسندگان این مقاله گفت: “این پیشرفت به ویژه برای استقرار LLM های پیشرفته در محیط های محدود به منابع بسیار مهم است و در نتیجه کاربرد و دسترسی آنها را گسترش می دهد.” این بهینه‌سازی‌ها به زودی به دستیاران و چت‌بات‌های پیچیده هوش مصنوعی اجازه می‌دهد تا به راحتی روی آیفون، آی‌پد و سایر دستگاه‌های تلفن همراه اجرا شوند.

چشم انداز استراتژیک اپل

هر دو مقاله رهبری رو به رشد اپل را در تحقیقات و برنامه های کاربردی هوش مصنوعی نشان می دهند. کارشناسان هشدار می‌دهند که در عین نویدبخش بودن، اپل باید هنگام استفاده از این فناوری‌ها در محصولات مصرف‌کننده دقت و مسئولیت زیادی به خرج دهد. از حفاظت از حریم خصوصی تا کاهش سوء استفاده، تاثیر اجتماعی باید در نظر گرفته شود.

از آنجایی که اپل به طور بالقوه این نوآوری ها را در مجموعه محصولات خود ادغام می کند، واضح است که این شرکت نه تنها دستگاه های خود را بهبود می بخشد، بلکه نیازهای آینده خدمات مبتنی بر هوش مصنوعی را نیز پیش بینی می کند. اپل با اجازه دادن به مدل‌های پیچیده‌تر هوش مصنوعی برای اجرا بر روی دستگاه‌هایی با حافظه محدود، به طور بالقوه زمینه را برای کلاس جدیدی از برنامه‌ها و سرویس‌ها فراهم می‌کند که از قدرت LLM‌ها به گونه‌ای استفاده می‌کنند که قبلا غیرممکن بود.

علاوه بر این، اپل با انتشار این تحقیق به جامعه گسترده‌تر هوش مصنوعی کمک می‌کند که می‌تواند پیشرفت‌های بیشتر در این زمینه را تحریک کند. این اقدامی است که نشان‌دهنده اعتماد اپل به موقعیت خود به‌عنوان یک رهبر فناوری و تعهد آن به جلو بردن مرزهای ممکن است.

آخرین نوآوری‌های اپل در صورتی که هوشمندانه اعمال شوند، می‌توانند هوش مصنوعی را به سطح بالاتری ببرند. آواتارهای دیجیتال واقعی و دستیارهای قدرتمند هوش مصنوعی در دستگاه های قابل حمل زمانی دور به نظر می رسید – اما به لطف دانشمندان اپل، آینده به سرعت در حال تبدیل شدن به واقعیت است.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/apples-latest-ai-research-could-completely-transform-your-iphone/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *