تقنيات هندسة البيانات 2021
الوسوم (تاج): العداد, داسك, هندسة البيانات, Databricks, داتايكو, داتا روبوت, DBT, فيفيتران, الشثني حيوان
إن التقنيات الناشئة التي تدعم مجال هندسة البيانات تنمو بوتيرة سريعة. تتضمن هذه القائمة المنسقة أهم العروض المتوفرة في عام 2021.
By تيك نينجا، مفتوح المصدر ، متحمس للتحليلات والسحابة.
قائمة جزئية لأفضل التقنيات الهندسية ، الصورة التي أنشأتها KDnuggets.
قائمة منسقة كاملة من التقنيات الناشئة في هندسة البيانات
- العداد AI، مؤسسة AI مع AutoML ، مساحة مماثلة لـ DataRobot.
- Algorithmia، MLOps المؤسسة.
- أموندسن، محرك اكتشاف البيانات والبيانات الوصفية مفتوح المصدر.
- أنودوت، يراقب جميع بياناتك في الوقت الفعلي لاكتشاف الحوادث بسرعة البرق.
- اباتشي ارو، ضروري بسبب عدم تنسيق JVM ، في الذاكرة ، تنسيق عمودي ومتجه.
- اباتشي كالسيت، إطار عمل لبناء قواعد بيانات SQL وأنظمة إدارة البيانات دون امتلاك بيانات. Hive و Flink وآخرون يستخدمون الكالسيت.
- اباتشي هوب، يسهل جميع جوانب تنسيق البيانات والبيانات الوصفية.
- اباتشي فيض هو تنسيق جدول مفتوح لمجموعات البيانات التحليلية الضخمة.
- اباتشي بينوت، مخزن بيانات OLAP الموزع في الوقت الفعلي. نموها مثير للإعجاب وهو في مساحة مماثلة ل Druid ، لكن ليس بالضبط!
- اباتشي سوبرست، ذكاء الأعمال مفتوح المصدر مع العديد من الموصلات المتاحة.
- شعاع، وتنفيذ مهام معالجة البيانات المجمعة والمتدفقة التي تعمل على أي محرك تنفيذ.
- كنفرغ، MLOps المؤسسة.
- تقاطع، أباتشي كافكا والنظام البيئي التالي.
- داغستر، منسق بيانات للتعلم الآلي ، يعتمد على البرمجة تمامًا وفي مساحة مماثلة لـ Airflow ، لكنه يركز على تدفق الحالة.
- داسك، علم البيانات بحتة في بايثون.
- داتا روبوت، منصة ML قوية مع تركيز قوي في MLOps للمؤسسات.
- Databricks، مع تحليلات SQL الجديدة وورقة Lakehouse ، نتوقع المزيد من OSS المدهشة.
- حوت DataFrame هي أداة مباشرة لاكتشاف البيانات.
- داتايكو، منصة مؤسسة AI / MLOps.
- دلتا ليك ، أسيد على أباتشي سبارك.
- DVC، نظام التحكم في الإصدار مفتوح المصدر لمشاريع ML والمطلوب لـ MLOps.
- وليمة، متجر ميزات مفتوح المصدر ، الآن مع Tecton.
- العابث، مؤسسة AI قابلة للتفسير.
- فيفيتران، خط أنابيب تكامل البيانات.
- Getdbt، هو الوصول إلى أفضل مكان في Apache Spark من خلال تقديم خط أنابيب مبسط قائم على SQL.
- توقعات كبيرة، إطار اختبار علوم البيانات ، إنه أمر مذهل بالفعل!
- هوبسورك، مخزن ميزات MLOps مفتوح المصدر.
- هودي يجلب المعاملات والتحديثات / الحذف على مستوى السجل وتغيير التدفقات إلى بحيرات البيانات.
- الكوالا، الباندا على أباتشي سبارك.
- • Kubeflow مشروع مخصص لجعل سير عمل التعلم الآلي على Kubernetes بسيطًا ومحمولًا وقابلًا للتطوير.
- ليكفس تمكنك من إدارة بحيرة البيانات الخاصة بك بالطريقة التي تدير بها التعليمات البرمجية الخاصة بك. قم بتشغيل خطوط أنابيب متوازية للتجريب و CI / CD لبياناتك.
- مايوت زينمل، إطار عمل MLOps مفتوح المصدر ، يحتوي على القليل من كل شيء.
- ماركيز، بيانات وصفية مفتوحة المصدر بواجهة مستخدم رائعة.
- التعريف، ذكاء أعمال مفتوح المصدر مع تصور ممتاز.
- MLFlow، منصة تعلم الآلة.
- مونتيكارلوداتاأو إدارة البيانات أو اكتشاف البيانات أو إمكانية ملاحظة البيانات.
- التدفق التالي، خطوط الأنابيب الحسابية التي تعتمد على البيانات والمصممة من أجل المعلوماتية الحيوية ، ولكنها يمكن أن تتجاوز ذلك.
- الشثني حيوان، منصة MLOps ، في مساحة MLFlow.
- ورق زجاجي، وضع معلمات لجهاز كمبيوتر محمول ، يجعل علوم البيانات أكثر إثارة ويسهل الوصول إليها.
- حاكم، مصمم لجعل إدارة سير العمل أسهل وأفضل مقارنة بتدفق الهواء من Apache.
- رابيدز، علم البيانات على وحدات معالجة الرسومات.
- شعاعوالتعلم الآلي الموزع والبث الآن.
- النجمي، أطلق العنان لقيمة البيانات الموزعة بجعل الوصول إليها سريعًا وسهلاً.
- TECTON، متجر ميزات المؤسسة.
- ترينو، المعروف أيضًا باسم PrestoSQL ، الآن مع فصل واضح عن Presto ، يمكن لـ Trino التركيز بشدة على الميزات.
أعيد ترتيبها أبجديًا ، بناءً على هذا أصلي. تم إعادة النشر بإذن.
هذا الموضوع ذو علاقة بـ:
أهم الأخبار في الثلاثين يومًا الماضية | |||||
---|---|---|---|---|---|
|
|
أفلاطون. Web3 مُعاد تصوره. تضخيم ذكاء البيانات.
انقر هنا للوصول.
المصدر: https://www.kdnuggets.com/2021/09/data-engineering-technologies-2021.html