آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.
داده های بزرگ وجود دارد، سپس داده های واقعاً بزرگ وجود دارد، جایی که می تواند تریلیون ها ردیف داده وجود داشته باشد. این فضایی است که در شیکاگو مستقر است خواهند خورد با مقیاس بزرگ خود است پایگاه داده تحلیلی فن آوری.
امروز این شرکت مجموعهای از قابلیتهای جدید را معرفی کرد که بستر دادههای فرامقیاس را برای تجزیه و تحلیل دادههای مکانی نیز گسترش میدهد. یادگیری ماشینی (ML) و هوش مصنوعی (AI). قابلیت جدید OcientGeo که در محصول Hyperscale Data Warehouse Ocient تعبیه شده است، یک کتابخانه گسترده از توابع جغرافیایی و یک شاخص فضایی بهینه شده در سطح جهانی را فراهم می کند. با OcientGeo، شرکتها اکنون میتوانند حجم عظیمی از دادههای مکانی تاریخی و بیدرنگ را دریافت و پردازش کنند تا بینشهای عملی ایجاد کنند. ابزارهای یکپارچه ML به کسب و کارها اجازه می دهد تا ابتکارات هوش مصنوعی جغرافیایی را تسریع کنند.
Ocient وعده استفاده از ذخیره سازی و پردازش بسیار بهینه شده را می دهد تا بتواند نیازهای داده های فوق مقیاس را بدون نیاز به استفاده از GPU ها مدیریت کند.
مدیر عامل Ocient میگوید: «تمرکز ما بر حجمهای کاری فرامقیاس است و من میتوانم بگویم که میانگین تعداد عناصری که در یک جستجوی Ocient متوسط مورد بررسی قرار میگیرند، خواه SQL، یادگیری ماشینی یا مکانی باشد، احتمالاً به طور متوسط یک تریلیون چیز است. کریس گلدوین به VentureBeat گفت.
تجزیه و تحلیل داده های فرامقیاس در مورد جریان است، نه GPU
امروزه برای بسیاری از موارد استفاده از محاسبات تسریع شده، سازمانها برای کمک به بهبود عملکرد به استفاده از GPU تمایل دارند. با این حال، این مسیری نیست که Ocient برای فعال کردن انبار داده خود طی می کند.
گلدوین میگوید: «کل نوع سس مخفی برای ارائه این سس، سطحی از موازیسازی است که بسیار شدید است. اصلاً غیرعادی نیست که در هر لایه در پشته، یک میلیون کار موازی در حال پرواز یا بیشتر وجود داشته باشد.
برای فعال کردن موازی سازی عظیم برای انبار داده، گلدوین گفت که همه چیز در مورد – جریان است. او توضیح داد که با الگوریتم های یادگیری ماشین برای خوشه بندی، رگرسیون و طبقه بندی، عملیات محاسباتی واقعی در یک CPU گلوگاه نیست. در عوض، گلوگاه اغلب چگالی محاسباتی است، زیرا نیاز به داشتن توان محاسباتی بیشتر برای هر ترابایت داده وجود دارد.
گلادوین گفت که چالش دریافت توان عملیاتی کافی در پشته محاسباتی از جمله فضای ذخیره سازی و حافظه است. این چالش اساس تمایز فنی Ocient است، زیرا این شرکت فناوری را برای بهینهسازی حافظه و سیستمهای ذخیرهسازی داده مبتنی بر درایو حالت جامد سریع (SSD) ساخته است.
گلدوین گفت: «مهندسین ما دوست دارند روی پردازندههای گرافیکی کار کنند، آنها فوقالعاده باحال هستند، اما ما نیازی به آن پیدا نکردیم.
اعتبار تصویر: Ocient / OcientML
یادگیری ماشین در مقیاس فوق العاده با OcientML
انبار داده Ocient با پرس و جوهای داده SQL شروع به کار کرد. همان معماری که پرس و جوهای تجزیه و تحلیل سریع را در مجموعه داده های عظیم فعال می کند نیز در پایه OcientML و قابلیت های OcientGeo قرار دارد.
گلدوین گفت که همان مزایای عملکرد در مقیاس فوق العاده، تجزیه و تحلیل بلادرنگ و بارگذاری داده که Ocient برای بارهای کاری SQL فراهم می کند اکنون برای ML در دسترس است. او گفت که OcientML به مشتریان اجازه میدهد تا یادگیری ماشینی را روی مجموعه دادهها با میلیاردها، صدها میلیارد یا تریلیونها نقطه داده در سطحی از عملکرد قیمت که بهتر از جایگزینها است، انجام دهند. همچنین شامل ویژگیهایی مانند مدیریت حجم کار برای اطمینان از دسترسی منصفانه به منابع در پرس و جوها و تجزیه و تحلیلهای مختلف است که در مقیاس فوقالعاده اجرا میشوند. OcientML پشته ML را مستقیماً با Ocient Hyperscale Data Warehouse ادغام می کند و نیاز به استخراج، تبدیل و بارگذاری داده ها را در یک پلت فرم جداگانه از بین می برد.
مزایای OcientML شامل افزایش دقت مدل با اجازه دادن به تعامل کامل با داده های تاریخی و فعلی، تکرار سریعتر با حذف مراحل جابجایی داده ها، و عملیات ساده شده با مدیریت SQL و ML در یک سیستم است.
قابلیت OcientGeo از الگوی مشابه OcientML پیروی می کند زیرا بخشی از هسته مرکزی Ocient Hyperscale Data Warehouse است و از موازی سازی عظیم این پلت فرم سود می برد. گلدوین خاطرنشان کرد که با OcientGEO، مشتریان میتوانند پرس و جوها، تجزیه و تحلیل و عملکردهای جغرافیایی را بر روی مجموعه دادههای عظیم به طور مستقیم در پلتفرم Ocient انجام دهند، بدون اینکه ابتدا مقادیر زیادی داده استخراج کنند. این اجازه می دهد تا پرس و جوها و تجزیه و تحلیل های شامل تریلیون ها نقطه داده با اجزای مکانی را در چند ثانیه در مقیاس عظیم اجرا کنند.
گلدوین گفت: «ما هنوز در حال شروع این سفر هستیم تا همه این استفادههای جدید را فعال کنیم که تنها با افزایش قیمت و عملکرد تجزیه و تحلیلهای مقیاس بزرگ ۱۰ برابر یا بیشتر میتوان آن را فعال کرد.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/data-infrastructure/ocient-scales-hyperscale-data-warehouse-for-machine-learning/