شعار زيفيرنت

مؤامرة مربعة في بيثون باستخدام Seaborn: دليل شامل

التاريخ:

المُقدّمة

في تحليل البيانات، تعد القدرة على تمثيل مجموعات البيانات المعقدة بشكل مرئي أمرًا لا يقدر بثمن. تقف Python، مع نظامها البيئي الغني بالمكتبات، في طليعة تصور البيانات، حيث تقدم أدوات تتراوح من المخططات البسيطة إلى المخططات التفاعلية المتقدمة. ومن بين هذه الخدمات، تتميز Seaborn بأنها مكتبة قوية لتصور البيانات الإحصائية، وهي مصممة لتسهيل استكشاف البيانات وفهمها وجعلها ممتعة من الناحية الجمالية. تتناول هذه المقالة إحدى الأدوات الأساسية لتصور البيانات — استخدام Box Plot في Python مع Seaborn للحصول على تمثيلات ثاقبة لمجموعة البيانات.

مؤامرة مربعة في بايثون باستخدام Seaborn:

جدول المحتويات

فهم تصور البيانات في بايثون

يستفيد تصور بيانات بايثون من مجموعة متنوعة من المكتبات. وتشمل هذه التصورات Matplotlib، وSeaborn، وPlotly، وPandas. لكل منها نقاط قوتها الخاصة لتمثيل البيانات. لا يساعد التصور في التحليل فحسب، بل يساعد أيضًا في نقل النتائج وتحديد الاتجاهات. يعتمد اختيار المكتبة على احتياجات المشروع. يمكن أن تتراوح من إنشاء قطع أرض بسيطة إلى إنشاء صور ويب تفاعلية.

اقرأ هذه المقالة لإتقان Box Plot في Python باستخدام Seaborn!

مقدمة إلى Seaborn كمكتبة لتصور البيانات الإحصائية

يعتمد Seaborn على Matplotlib، ويتكامل بشكل وثيق مع Pandas DataFrames لتقديم واجهة عالية المستوى لرسم رسومات إحصائية جذابة وغنية بالمعلومات. إنه يبسط عملية إنشاء تصورات معقدة ويوفر الأنماط الافتراضية ولوحات الألوان لجعل الرسوم البيانية أكثر جاذبية بصريًا وقابلة للقراءة. تتفوق Seaborn في إنشاء مخططات معقدة باستخدام الحد الأدنى من التعليمات البرمجية، مما يجعلها الخيار المفضل للإحصائيين وعلماء البيانات والمحللين.

تعريف وأهمية المؤامرات الصندوقية في تحليل البيانات

مخطط الصندوق، المعروف أيضًا باسم مخطط الصندوق والطرفين، هو طريقة موحدة لعرض توزيع البيانات استنادًا إلى ملخص مكون من خمسة أرقام: الحد الأدنى، والربيع الأول (Q1)، والوسيط، والربيع الثالث (Q3)، و أقصى. ويمكنه أيضًا الإشارة إلى القيم المتطرفة في مجموعة البيانات. يمثل المربع النطاق الربعي (IQR)، ويوضح الخط الموجود داخل المربع الوسيط، وتمتد "الشعيرات" لإظهار نطاق البيانات، باستثناء القيم المتطرفة. تعتبر المؤامرات الصندوقية مهمة لعدة أسباب:

  • ملخص فعال: أنها توفر ملخصًا موجزًا ​​لتوزيع البيانات وتنوعها دون تفاصيل كثيرة، مما يجعلها مثالية لتحليل البيانات الأولية.
  • مقارنة: تسمح المخططات الصندوقية بإجراء مقارنة سهلة بين مجموعات البيانات أو المجموعات المختلفة داخل مجموعة البيانات، مع تسليط الضوء على الاختلافات في المتوسطات ومعدلات الذكاء السريع وانتشار البيانات بشكل عام.
  • الكشف الخارجي: فهي مفيدة في تحديد القيم المتطرفة، والتي يمكن أن تكون حاسمة لتنظيف البيانات أو الكشف عن الحالات الشاذة.

مؤامرة مربعة باستخدام Seaborn

تُعد وظيفة boxplot الخاصة بـ Seaborn أداة متعددة الاستخدامات لإنشاء مخططات مربعة، وتقدم مجموعة واسعة من المعلمات لتخصيص التصور ليناسب احتياجات تحليل البيانات الخاصة بك. هناك عدد من المعلمات المستخدمة في وظيفة boxplot.

سيبورن بوكسبلوت (البيانات = لا شيء, *, س = لا شيء, ص = لا شيء, هوى = لا شيء, الطلب=لا شيء, hue_order=لا شيء, المشرق = لا شيء, اللون = لا شيء, لوحة = لا شيء, التشبع=0.75, ملء = صحيح, دودج = "تلقائي", العرض = 0.8, الفجوة = 0, ويس=1.5, لون الخط = "تلقائي", عرض الخط = لا شيء, حجم الطيارة = لا شيء, hue_norm=لا شيء, original_scale=خطأ, log_scale=لا شيء, المنسق = لا شيء, أسطورة = "تلقائي", الفأس = لا شيء, ** kwargs)

لنقم بإنشاء مخطط boxplot أساسي باستخدام Seaborn:

فيما يلي تفاصيل المعلمات الأساسية التي يمكنك استخدامها مع Seaborn's boxplot:

معلمات الأساسي

  • س، ص، هوى: مدخلات لرسم البيانات الطويلة. x وy هي أسماء المتغيرات في البيانات أو البيانات المتجهة. يتم استخدام تدرج اللون لتحديد مجموعات مختلفة، مما يضيف بعدًا آخر إلى الحبكة للمقارنة.
  • البيانات: مجموعة بيانات للتخطيط. يمكن أن يكون Pandas DataFrame أو صفيفًا أو قائمة صفائف.

المعلمات الجمالية

  • النظام، hue_order: حدد ترتيب مستويات قطعة الأرض المربعة. يؤثر الترتيب على ترتيب المربعات نفسها إذا كانت البيانات قاطعة. يتحكم hue_order في ترتيب الأشكال عند استخدام متغير hue.
  • المشرق: اتجاه قطعة الأرض ('v' للرأسي أو 'h' للأفقي). ويتم تحديده تلقائيًا بناءً على متغيرات الإدخال إذا لم يتم تحديدها.
  • اللون: اللون لجميع عناصر مؤامرات الصندوق. يمكن أن يكون مفيدًا عندما تحتاج إلى نظام ألوان مختلف عن النظام الافتراضي.
  • لوحة الألوان: الألوان المستخدمة للمستويات المختلفة لمتغير الصبغة. فهو يسمح بتعيين ألوان مخصصة للتمييز بشكل أفضل بين المجموعات.
  • التشبع: نسبة التشبع الأصلي لرسم الألوان. قد يؤدي خفضه إلى تحسين إمكانية القراءة عند استخدام ألوان عالية التشبع.

معلمات الصندوق

  • عرض: عرض العنصر الكامل (الصندوق والشعيرات). يمكن أن يساعد ضبط ذلك عند تخطيط العديد من المجموعات لتجنب التداخل أو لتسهيل قراءة المخطط.
  • مراوغة: عند استخدام الصبغة، سيؤدي ضبط المراوغة على False إلى رسم العناصر الموجودة في فئة الصبغة بجوار بعضها البعض. افتراضيًا، هذا صحيح، مما يعني أنه يتم تجنب العناصر بحيث يتم فصل كل مربع بشكل واضح.

هل ترغب في تعلم لغة بايثون مجانًا؟ قم بالتسجيل في موقعنا مقدمة لبرنامج بايثون اليوم!

المعلمات الشارب والمعلمات الخارجية

  • ويس: يحدد مدى وصول الشعيرات إلى ما بعد الربعين الأول والثالث. يمكن أن يكون عبارة عن سلسلة من النسب المئوية (على سبيل المثال، [5، 95]) تحدد النسب المئوية الدقيقة للشعيرات أو رقم يشير إلى نسبة معدل الذكاء IQR (القيمة الافتراضية هي 1.5).
  • عرض الخط: عرض الخطوط الرمادية التي تؤطر عناصر الحبكة.

وفي الختام

في استكشافنا للمخططات الصندوقية في بايثون باستخدام Seaborn، رأينا أداة قوية لتصور البيانات الإحصائية. يعمل Seaborn على تبسيط البيانات المعقدة إلى مخططات مربعة ثاقبة من خلال تركيب الجملة وخيارات التخصيص الأنيقة. تساعد هذه المخططات في تحديد الاتجاهات المركزية والمتغيرات والقيم المتطرفة، مما يجعل التحليل المقارن واستكشاف البيانات فعالاً.

لا يقتصر استخدام الحبكات الصندوقية لـ Seaborn على العناصر المرئية فقط؛ يتعلق الأمر بالكشف عن الروايات المخفية داخل بياناتك. فهو يجعل المعلومات المعقدة في متناول الجميع وقابلة للتنفيذ. تعد هذه الرحلة بمثابة نقطة انطلاق لإتقان تصور البيانات في لغة بايثون، وتعزيز المزيد من الاكتشاف والابتكار.

نحن نقدم مجموعة من الدورات التدريبية المجانية حول تصور البيانات. تحقق منها هنا.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة