VentureBeat ارائه می دهد: AI Unleashed – یک رویداد اجرایی انحصاری برای رهبران داده های سازمانی. در ۱۵ نوامبر از رهبران برتر صنعت بشنوید. پاس رایگان خود را رزرو کنید
مایکروسافت در تلاش توسعه مشارکت منبع باز جدیدی که امروز اعلام شد، به گوگل و Onehouse در حمایت از پروژه OneTable، که می تواند چشم انداز دریاچه داده های ابری را برای سال های آینده تغییر دهد.
طی چندین سال گذشته، سازمانها مجبور بودهاند در مورد فرمت جدول دریاچه دادهها تصمیم بگیرند. این تصمیمی است که به طور بالقوه می تواند منجر به قفل شدن فروشنده و چالش های سازگاری برای تجزیه و تحلیل داده ها و حجم کاری هوش مصنوعی شود. از جمله فرمت های جدول دریاچه داده های اولیه می توان به کوه یخ آپاچی و آپاچی هودی فن آوری ها و همچنین دریاچه دلتا به رهبری دیتابریکس.
پروژه OneTable که توسط Onehouse آغاز شد، تلاشی برای ایجاد یک لایه جدید است که در بالای فرمتهای جدول دریاچه داده قرار میگیرد که تبدیلهای همه جهته و دسترسی به Iceberg، Hudi و Delta Lake را ممکن میسازد.
Onehouse ابتدا اعلام کرد یک میز در ماه فوریه، در کنار ۲۵ میلیون دلار افزایش بودجه، و اکنون این تلاش به طور قابل توجهی به عنوان یک پروژه منبع باز که از حمایت مایکروسافت و گوگل، با سایر فروشندگان از جمله آمازون، در حال بحث برای مشارکت در آینده است، گسترش یافته است.
وینوث چاندار، بنیانگذار و مدیر عامل Onehouse به VentureBeat گفت: «در طول این سال، ما با مشتریان خود و همچنین با گوگل و مایکروسافت و گروهی از افراد مختلف کار کرده ایم تا این ایده را گسترش دهیم و شکل و شکل بیشتری به آن بیاوریم. “من فکر می کنم اکنون در این مرحله هستیم که آماده هستیم تا OneTable منبع باز را به عنوان کمک خود به جامعه ارائه دهیم و مطمئن شویم که مکانی برای فرمت متقابل وجود دارد، قابلیت همکاری که توسط برخی از اینفلوئنسرهای کلیدی پشتیبانی می شود. [data lake table] فرمت ها.”
مایکروسافت فابریک داده را روشن می کند و OneTable را در آغوش می گیرد
مایکروسافت رویکرد دریاچه داده خود را به نام دارد پارچهکه از قالب جدول دلتا لیک پشتیبانی می کند و بخش مهمی از آن است تلاش مایکروسافت برای ایجاد یک چارچوب واحد و باز برای مشتریانش (به اطلاعیه های امروز دیگر در این باره مراجعه کنید). پیوستن به تلاش برای حمایت از OneTable به معنای کمک به فعال کردن باز بودن است.
راگو راماکریشنان، مدیر ارشد فناوری اطلاعات در مایکروسافت، به VentureBeat گفت: «ما مسیری میخواهیم که مردم بتوانند در اکوسیستم ما بدون احساس مسدود شدن خرید کنند.
راماکریشنان خاطرنشان کرد که امروزه در سراسر چشم انداز دریاچه داده تنوع وجود دارد. دریاچه دلتای دیتابریکس پایگاه رو به رشدی از کاربران دارد، آیسبرگ توسط چندین فروشنده از جمله Snowflake و Cloudera پشتیبانی میشود، Hudi نیز سهم مناسبی از کاربران و حامیان خود دارد، از جمله غول خردهفروشی Walmart. توانایی استفاده و پرس و جو از داده ها در قالب های جدول دریاچه داده یک قابلیت حیاتی است.
“نداشتن این [OneTable] راماکریشنان گفت: “انحصاری بودن برای مشتریان ما و صادقانه بگویم برای ما فوق العاده مفید خواهد بود.” در نهایت، امید واقعی من در اینجا این است که با هم بتوانیم اکوسیستمی ایجاد کنیم که در آن مشتریان بتوانند به بهترین راه حل بروند بدون اینکه در بند باشند. توسط داده های اساسی
گوگل OneTable را به عنوان دریاچه داده “Babelfish” می بیند
گوگل پلتفرم دریاچه داده خود را با فناوری توسعه داده است جداول BigLake از جمله تلاش های دیگر پشتیبانی از OneTable به عنوان یک تلاش منبع باز توسط گوگل به عنوان کلیدی برای فعال کردن هدف داشتن معماری داده باز تلقی می شود.
گریت کازمایر، معاون داده و تجزیه و تحلیل در شرکت: “ما BigLake را ساختیم، زیرا ما واقعاً مزایای معماری داده های باز را می بینیم.” گوگل Cloud به VentureBeat گفت.
کازمایر خاطرنشان کرد که تا به امروز یک چالش واقعی وجود داشته است که در آن سازمان ها مجبور بوده اند در مورد قالب جدولی که انتخاب می کنند، انتخاب های سختی انجام دهند. بسته به فناوری، یک سازمان می تواند به روشی برای مدیریت، دسترسی و کنترل داده ها که می تواند پیامدهای بلندمدتی داشته باشد، قفل شود.
او گفت: “فرمت های آزاد و باز مانند Iceberg وجود دارد، اما ممکن است بارهای کاری دیگری در حال اجرا باشد که به فرمت دیگری بستگی دارد که فرمت فایل اصلی انتخابی شما نیست.” “این جایی است که OneTable کمک می کند، به نوعی شبیه ماهی بابل است.”
بابل ماهی یک خلاقیت تخیلی از کلاسیک علمی تخیلی است، راهنمای سفر به کهکشان، که افراد را قادر می سازد به طور خودکار زبان های مختلف را ترجمه و درک کنند. کازمایر گفت که OneTable جایگزین فرمتهای مختلف جدول دادهها نخواهد شد، اما بار سازمانها را در مورد انتخاب قالبی که ممکن است در آن قفل شده باشند، برمیدارد.
توانایی فعال کردن قابلیت همکاری در بین قالبها برای Google حیاتی است زیرا در دسترس بودن خود را گسترش میدهد تجزیه و تحلیل داده های BigQuery Omni فن آوری. Kazmaier گفت که Omni اساسا BigQuery را به AWS و Microsoft Azure گسترش می دهد و این سرویسی است که به سرعت در حال رشد است. از آنجایی که سازمانها به دنبال انجام پردازش و تجزیه و تحلیل دادهها در ابرها هستند، ممکن است فرمتهای متفاوتی وجود داشته باشد و یک سوال متداول مطرح میشود این است که چگونه میتوان چشمانداز دادهها را به هم متصل کرد و چگونه میتوان از تقسیمبندی احتمالی جلوگیری کرد.
کازمایر گفت: “ما فکر می کنیم OneTable یک رویکرد عالی برای آن است و واقعاً با اصل باز بودن ما هماهنگ است.”
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/data-infrastructure/exclusive-microsoft-and-google-join-forces-on-onetable-an-open-source-solution-for-data-lake-challenges/