شعار زيفيرنت

تقنيات هندسة البيانات 2021

التاريخ:

تقنيات هندسة البيانات 2021

إن التقنيات الناشئة التي تدعم مجال هندسة البيانات تنمو بوتيرة سريعة. تتضمن هذه القائمة المنسقة أهم العروض المتوفرة في عام 2021.


By تيك نينجا، مفتوح المصدر ، متحمس للتحليلات والسحابة.

أعلى تقنيات هندسة البيانات
قائمة جزئية لأفضل التقنيات الهندسية ، الصورة التي أنشأتها KDnuggets.

قائمة منسقة كاملة من التقنيات الناشئة في هندسة البيانات

  • العداد AI، مؤسسة AI مع AutoML ، مساحة مماثلة لـ DataRobot.
  • Algorithmia، MLOps المؤسسة.
  • أموندسن، محرك اكتشاف البيانات والبيانات الوصفية مفتوح المصدر.
  • أنودوت، يراقب جميع بياناتك في الوقت الفعلي لاكتشاف الحوادث بسرعة البرق.
  • اباتشي ارو، ضروري بسبب عدم تنسيق JVM ، في الذاكرة ، تنسيق عمودي ومتجه.
  • اباتشي كالسيت، إطار عمل لبناء قواعد بيانات SQL وأنظمة إدارة البيانات دون امتلاك بيانات. Hive و Flink وآخرون يستخدمون الكالسيت.
  • اباتشي هوب، يسهل جميع جوانب تنسيق البيانات والبيانات الوصفية.
  • اباتشي فيض هو تنسيق جدول مفتوح لمجموعات البيانات التحليلية الضخمة.
  • اباتشي بينوت، مخزن بيانات OLAP الموزع في الوقت الفعلي. نموها مثير للإعجاب وهو في مساحة مماثلة ل Druid ، لكن ليس بالضبط!
  • اباتشي سوبرست، ذكاء الأعمال مفتوح المصدر مع العديد من الموصلات المتاحة.
  • شعاع، وتنفيذ مهام معالجة البيانات المجمعة والمتدفقة التي تعمل على أي محرك تنفيذ.
  • كنفرغ، MLOps المؤسسة.
  • تقاطع، أباتشي كافكا والنظام البيئي التالي.
  • داغستر، منسق بيانات للتعلم الآلي ، يعتمد على البرمجة تمامًا وفي مساحة مماثلة لـ Airflow ، لكنه يركز على تدفق الحالة.
  • داسك، علم البيانات بحتة في بايثون.
  • داتا روبوت، منصة ML قوية مع تركيز قوي في MLOps للمؤسسات.
  • Databricks، مع تحليلات SQL الجديدة وورقة Lakehouse ، نتوقع المزيد من OSS المدهشة.
  • حوت DataFrame هي أداة مباشرة لاكتشاف البيانات.
  • داتايكو، منصة مؤسسة AI / MLOps.
  • دلتا ليك ، أسيد على أباتشي سبارك.
  • DVC، نظام التحكم في الإصدار مفتوح المصدر لمشاريع ML والمطلوب لـ MLOps.
  • وليمة، متجر ميزات مفتوح المصدر ، الآن مع Tecton.
  • العابث، مؤسسة AI قابلة للتفسير.
  • فيفيتران، خط أنابيب تكامل البيانات.
  • Getdbt، هو الوصول إلى أفضل مكان في Apache Spark من خلال تقديم خط أنابيب مبسط قائم على SQL.
  • توقعات كبيرة، إطار اختبار علوم البيانات ، إنه أمر مذهل بالفعل!
  • هوبسورك، مخزن ميزات MLOps مفتوح المصدر.
  • هودي يجلب المعاملات والتحديثات / الحذف على مستوى السجل وتغيير التدفقات إلى بحيرات البيانات.
  • الكوالا، الباندا على أباتشي سبارك.
  • Kubeflow مشروع مخصص لجعل سير عمل التعلم الآلي على Kubernetes بسيطًا ومحمولًا وقابلًا للتطوير.
  • ليكفس تمكنك من إدارة بحيرة البيانات الخاصة بك بالطريقة التي تدير بها التعليمات البرمجية الخاصة بك. قم بتشغيل خطوط أنابيب متوازية للتجريب و CI / CD لبياناتك.
  • مايوت زينمل، إطار عمل MLOps مفتوح المصدر ، يحتوي على القليل من كل شيء.
  • ماركيز، بيانات وصفية مفتوحة المصدر بواجهة مستخدم رائعة.
  • التعريف، ذكاء أعمال مفتوح المصدر مع تصور ممتاز.
  • MLFlow، منصة تعلم الآلة.
  • مونتيكارلوداتاأو إدارة البيانات أو اكتشاف البيانات أو إمكانية ملاحظة البيانات.
  • التدفق التالي، خطوط الأنابيب الحسابية التي تعتمد على البيانات والمصممة من أجل المعلوماتية الحيوية ، ولكنها يمكن أن تتجاوز ذلك.
  • الشثني حيوان، منصة MLOps ، في مساحة MLFlow.
  • ورق زجاجي، وضع معلمات لجهاز كمبيوتر محمول ، يجعل علوم البيانات أكثر إثارة ويسهل الوصول إليها.
  • حاكم، مصمم لجعل إدارة سير العمل أسهل وأفضل مقارنة بتدفق الهواء من Apache.
  • رابيدز، علم البيانات على وحدات معالجة الرسومات.
  • شعاعوالتعلم الآلي الموزع والبث الآن.
  • النجمي، أطلق العنان لقيمة البيانات الموزعة بجعل الوصول إليها سريعًا وسهلاً.
  • TECTON، متجر ميزات المؤسسة.
  • ترينو، المعروف أيضًا باسم PrestoSQL ، الآن مع فصل واضح عن Presto ، يمكن لـ Trino التركيز بشدة على الميزات.

أعيد ترتيبها أبجديًا ، بناءً على هذا أصلي. تم إعادة النشر بإذن.

هذا الموضوع ذو علاقة بـ:


أفلاطون. Web3 مُعاد تصوره. تضخيم ذكاء البيانات.
انقر هنا للوصول.

المصدر: https://www.kdnuggets.com/2021/09/data-engineering-technologies-2021.html

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة