في Data + AI Summit ، جعلت Databricks اليوم العدد المطلوب من الإعلانات التي يتوقعها المرء من حدث مطور رئيسي للشركة. من بين هذه هي إطلاق Delta Lake 2.0 ، الإصدار التالي من منصتها لبناء بيانات LakeHouses ، MLFLOW 2.0 ، الجيل التالي من منصته لإدارة خط أنابيب التعلم الآلي ، والذي يتضمن الآن خطوط أنابيب MLFLOW مع قوالب لتطوير نموذج التمهيد و اثنين من الإعلانات حول Apache Spark Data Analytics Engine ، الذي يشكل جزءًا من جوهر منصة Databricks.
مع Spark Connect ، أعلنت DataBricks اليوم عن واجهة عميل وخادم جديدة للشرارة التي تعتمد على API DataFrame API . في Spark ، فإن DataFrame عبارة عن مجموعة موزعة من البيانات التي يتم تنظيمها في أعمدة وتُتاح من خلال واجهة برمجة التطبيقات بلغات مثل Scala أو Java أو Python أو R. مع Spark Connect ، وتأخذ Databricks هذا المفهوم ولكن بعد ذلك يفصل العميل والخادم ، وهو ما ، وهو الخادم ، الذي تقول الشركة إنها ستؤدي إلى استقرار أفضل وتمكين الاتصال عن بُعد كميزة مدمجة. محرك تدفق. يجادل DataBricks بأنه نظرًا لأن المزيد من التطبيقات تتطلب الآن بيانات التدفق ، فإن متطلبات ما يمكن أن توفره محركات البث قد تغيرت أيضًا.
تم تبني البث المهيكلة Spark على نطاق واسع منذ الأيام الأولى من التدفق بسبب سهولة الاستخدام والأداء ، تشرح الشركة مجتمعات بيئية كبيرة ومجتمعات المطورين في إعلان اليوم. مع وضع ذلك في الاعتبار ، ستتعاون Databricks مع المجتمع وتشجع المشاركة في Project Lightspeed لتحسين الأداء ، ودعم النظام الإيكولوجي للموصلات ، وتعزيز الوظائف لمعالجة البيانات مع مشغلي وواجهة برمجة التطبيقات الجديدة ، وتبسيط النشر والعمليات والمراقبة وإصلاحها.
أخبرني متحدث باسم DataBricks أن المشروع سيقوده كارثيك راماسامي ، رئيس الشركة للبث ، مع التركيز على تقديم إنتاجية أعلى ، انخفاض الكمون وتكلفة أقل ، بالإضافة إلى نظام بيئي موسع للموصلات ومعالجة البيانات الإضافية الوظيفة.
TechCrunch+ لديها بيع يوم استقلال! وفر 50 ٪ على اشتراك سنوي هنا. مزيد من المعلومات.
اخلاء مسؤولية! هذا المقال لا يعبر بالضرورة عن رأي جامعة الرازي