شعار زيفيرنت

أربع ميزات جديدة لـ Apache Cassandra 5.0 مثيرة للاهتمام - البيانات

التاريخ:

مع الأخيرة الإصدار التجريبي من Apache Cassandra 5.0، يعد الآن وقتًا رائعًا للفرق لتجربته واكتشاف القدرات الجديدة الأكثر إثارة للاهتمام والمتوقعة للإصدار 5.0. 

أثناء بحثي في ​​الإصدار التجريبي الجديد، إليك أربع ميزات تم تقديمها مع Cassandra 5.0 مفتوح المصدر والتي يجب أن تكون فرق التطوير متحمسة لها:

1. دعم المتجهات: تقديم بحث المتجهات والوظائف الجديدة ونوع بيانات المتجهات الجديد

يضيف كاساندرا 5.0 بحث المتجهات، وهي ميزة جديدة قوية بشكل خاص للعثور على المحتوى ذي الصلة ضمن مجموعات البيانات الكبيرة، إلى جانب وظائف CQL الجديدة ونوع بيانات متجه جديد يحفظ ويستعيد ناقلات التضمين. والأهم بالنسبة للكثيرين، أن هذه الميزات الجديدة تجعل من Cassandra 5.0 تقنية طبقة بيانات مثالية للفرق التي تتابع مشاريع الذكاء الاصطناعي/تعلم الآلة - مما يوفر الوظائف المحددة التي تتطلبها تلك المشاريع إلى جانب التوفر العالي الحالي لـ Cassandra وقابلية التوسع والفوائد مفتوحة المصدر. 

بالنسبة لنماذج تعلم الآلة، يعد إجراء مقارنات التشابه أمرًا بالغ الأهمية لفهم البيانات واتصالات البيانات في السياق. على سبيل المثال، تطبيقات الذكاء الاصطناعي من محركات توصية المنتج إلى الذكاء الاصطناعي التوليدي تعمل روبوتات الدردشة من خلال التعرف على الأنماط واستقراء عملية صنع القرار بناءً على تشابه مدخلات البيانات الجديدة والاستعلامات مع بيانات التدريب الحالية. إن القدرة على تخزين ناقلات التضمين – وهي عبارة عن صفائف من أرقام الفاصلة العائمة التي تنقل مدى تشابه الكائنات أو الكيانات المحددة مع بعضها البعض – يعد أمرًا أساسيًا لتمكين مقارنات التشابه الحاسمة هذه. لذلك، أصبح Cassandra 5.0 الآن الحل الأمثل لتطوير تطبيقات الذكاء الاصطناعي.

2. الفهرسة المرفقة بالتخزين

تعمل الفهرسة المرفقة بالتخزين (SAI) الجديدة من Cassandra 5.0 على تحسين دورة حياة الفهارس الثانوية، مع جعلها أيضًا مخازن أكثر كفاءة وأسهل في الاستخدام. يسمح SAI لمستخدمي Cassandra بإنشاء فهرس ثانوي واحد أو أكثر في جدول قاعدة البيانات، حيث يعتمد كل فهرس على عمود واحد من اختيار المستخدم.

توفر هذه الفهرسة على مستوى الأعمدة والقابلة للتطوير بشكل كبير والموزعة عالميًا إنتاجية إدخال/إخراج لا مثيل لها للبحث - بما في ذلك بحث المتجهات. يتميز الجهاز الأعلى للرقابة المالية (SAI) أيضًا بقابلية التوسعة المعيارية، حيث يعمل البحث المتجه كعرض أولي لهذه الإمكانية. يمكن لفهارس الجهاز الأعلى للرقابة المالية والمحاسبة التقاط الدلالات عن طريق فهرسة كل من الاستعلامات والمحتوى (بما في ذلك المدخلات الكبيرة مثل المستندات والصور) لتحقيق وظيفة فهرسة استثنائية.

3. جداول الذاكرة الثلاثية وجداول SSTables المفهرسة

يمكن لمستخدمي Cassandra 5.0 الاستفادة من التحسينات الكبيرة المحتملة في الأداء وتحسين الذاكرة التي تأتي مع Memtables وSSTables المستندة إلى trie (شجرة البادئة) الجديدة لهذا الإصدار. في حين أن Cassandra مشهورة ببنيتها الموزعة، فإن تنسيقات التخزين هذه تستخدم محاولات وتمثيلات قابلة للمقارنة بالبايت لمفاتيح قاعدة البيانات لتحسين أداء Cassandra لعمليات القراءة والتعديل، بالإضافة إلى تحديد حجم الهياكل بشكل صحيح للبيانات. تعمل Trie Memtables وTrie-Indexed SSTables أيضًا على تقليل أعباء إدارة الذاكرة وجمع البيانات المهملة، مما يسهل على المؤسسات كبيرة الحجم إدارة بياناتها.

خلاصة القول: هذه الميزات لتقليل حمل التخزين - مع تحسين قابلية التوسع وأداء الكتابة والقراءة - ستجذب انتباه مستخدمي Cassandra وتقديرهم. 

4. وظائف التجميع والرياضيات الجديدة

يضيف Cassandra 5.0 وظائف CQL أصلية جديدة، وقدرة المستخدمين على إنشاء وظائف جديدة محددة من قبل المستخدم. تعمل هذه الإضافات على توسيع السرعة والمرونة التي يمكن للمستخدمين من خلالها تحقيق أهدافهم باستخدام Cassandra.

تتضمن وظائف التجميع الأصلية الجديدة ما يلي:

  • العد - ابحث عن عدد العناصر الموجودة في المجموعة
  • الحد الأقصى والحد الأدنى - ابحث عن الحد الأقصى أو الأدنى لعناصر المجموعة
  • المجموع والمتوسط ​​– ابحث عن مجموع أو متوسط ​​العناصر في مجموعة رقمية

تتضمن الوظائف الأصلية الجديدة للعمل على أعمدة المجموعة ما يلي:

  • Map_keys - احصل على مفاتيح الخريطة
  • Map_values ​​- احصل على قيم الخريطة

تتضمن وظائف الرياضيات الأصلية الجديدة ما يلي:

  • القيمة المطلقة - إرجاع القيمة المطلقة لـ x
  • exp - إرجاع قيمة e (أساس اللوغاريتمات الطبيعية) إلى قوة الإدخال
  • سجل - إرجاع اللوغاريتم الطبيعي (الأساس e) للإدخال
  • log10 – إرجاع اللوغاريتم الأساسي 10 للإدخال
  • جولة - إرجاع أقرب عدد صحيح للإدخال

جربها

يجب على المهتمين باستغلال مزايا Cassandra 5.0 الموضحة هنا أن يجربوها بأنفسهم، وأن يتقدموا في المنحنى عندما يتعلق الأمر باستخدام وتحسين Cassandra مفتوح المصدر بالكامل.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة