شعار زيفيرنت

كيفية إنشاء بيانات وهمية في Python باستخدام Faker Package

التاريخ:

تم نشر هذه المقالة كجزء من مدونة علوم البيانات

هناك حاجة إلى البيانات الوهمية لمجموعة متنوعة من الأغراض. قد يكون العثور على البيانات المطلوبة بتنسيق معين أمرًا صعبًا. تستكشف هذه المقالة الطرق المختلفة لإنشاء البيانات الوهمية باستخدام حزمة Faker في بايثون.

الموضوعات التي يتم تناولها في هذه المقالة هي كما يلي:

  • ما هي البيانات الوهمية؟
  • لماذا نحتاج بيانات وهمية؟
  • كيفية تثبيت حزمة الفاكر؟
  • كيفية إنشاء وتهيئة Faker Generator؟
  • كيفية إنشاء اسم وعنوان ونص عشوائي باستخدام فاكر؟
  • كيف تصنع نفس البيانات الوهمية؟
  • كيف تصنع بيانات وهمية فريدة؟
  • كيفية إنشاء بيانات وهمية متعلقة بالعملات باستخدام Faker؟
  • كيفية إنشاء بيانات وهمية مترجمة باستخدام Faker؟
  • كيفية إنشاء مجموعة بيانات وهمية باستخدام Faker؟
  • من هم المزودون؟
  • استخدام سطر الأوامر لحزمة Faker
  • طرق بديلة لإنشاء بيانات وهمية في بايثون

 

ما هي البيانات الوهمية؟

البيانات الوهمية تسمى أيضًا البيانات العشوائية. كما يوحي الاسم ، فإن البيانات المزيفة يتم إنشاؤها عشوائيًا. يعمل كبديل أو عنصر نائب للبيانات الحية.

 

لماذا نحتاج إلى بيانات وهمية؟

تُستخدم البيانات الوهمية لأغراض الاختبار والتشغيل. يتم استخدامه لاختبار ما قمت بتطويره وكيف تتفاعل التعليمات البرمجية الخاصة بك مع أنواع مختلفة من المدخلات.

في Python ، يمكن للمرء إنشاء البيانات الوهمية باستخدام حزمة Faker. إنها مكتبة مفتوحة المصدر تنتج بيانات وهمية من العديد من الأنواع المختلفة.

 

كيفية تثبيت حزمة Faker للبيانات الوهمية؟

يمكن للمرء تثبيت حزمة Faker باستخدام أمر pip على النحو التالي:

تثبيت Pip Faker

 

كيفية إنشاء وتهيئة مولد Faker؟

يمكن للمرء استخدام طريقة Faker () لإنشاء وتهيئة Faker Generator.

من faker import Faker fake = Faker ()

الآن ، نظرًا لأنك جاهز بتثبيت وتهيئة مُنشئ Faker ، يمكنك إنشاء أي بيانات تريدها.

 

كيفية إنشاء اسم وعنوان ونص عشوائي باستخدام Faker؟

يمكن استخدام طريقة الاسم () لإنشاء اسم كامل. إذا كنت تريد الاسم الأول فقط أو اسم العائلة بدلاً من الاسم الكامل ، يمكنك استخدام الأسلوبين first_name () و last_name ().

كل استدعاء لهذه الطرق سيولد اسمًا عشوائيًا.

دعنا ننتقل إلى الكود لنرى كيف تعمل هذه الطرق.

fake.first_name () "داني"
fake.last_name () "رايلي" 
fake.name () "جون مارتينيز"

لإنشاء عنوان ونص عشوائي ، يمكنك استخدام أساليب العنوان () والنص ().

fake.address () "4843 Gordon Field Suite 617nSouth Karen، SC 39850"
fake.text () "تداول اللعبة كان مختلفًا. يمكن أن يكون هناك بين البرنامج. يُعتقد أن المليون منتج صغير على طول كليهما. nCost أفضل أسبوع يخبر سلطة رأس المال. أتمنى الطعام داخل مساء بعيد بلدي. ذبابة بسيطة كسر مهنة ربما.

طريقة النص () أعلاه خلقت فقرة واحدة.

لإنشاء أسماء متعددة ، يمكنك وضع طريقة name () في حلقة for على النحو التالي:

لـ _ في النطاق (10): طباعة (اسم مزيف ())

د. ماريسا فالنسيا DDS
جيسيكا بيرد
آنا مينديز
جيسيكا روبرتسون
مارفن دنكان
روبرت جود
باربرا جاكسون
جيمس فولكنر
القدر هارفي
كريستين هيوز


 

كيفية إنشاء نفس البيانات الوهمية باستخدام Faker Package؟

في بعض الحالات ، قد ترغب في إعادة إنتاج نفس مجموعة البيانات. من الممكن عن طريق بذر المولد. يمكنك استخدام طريقة seed () لإنتاج نفس البيانات الوهمية على النحو التالي:

Faker.seed (111) print (fake.first_name ())
'كريستي بندر'

 

كيفية إنشاء بيانات وهمية فريدة باستخدام Faker Package؟

للتأكد من أن البيانات الوهمية التي تم إنشاؤها فريدة من نوعها ، يمكنك استخدام الخاصية الفريدة للمولد.

الأسماء = [fake.unique.first_name () For i in نطاق (100)]

في كل مرة ، سيتم تنفيذ الكود أعلاه ، وسوف ينتج عنه 100 اسم فريد.

 

كيفية إنشاء بيانات وهمية متعلقة بالعملات باستخدام حزمة Faker؟

يمكنك استخدام خصائص Faker () التالية لإنشاء بيانات وهمية متعلقة بالعملات المشفرة

cryptocurrency () - تقوم بإنشاء اسم العملة المشفرة والرمز المقابل لها.

cryptocurrency_name () - يقوم بإنشاء اسم cryptocurrency.

cryptocurrency_code () - يقوم بإنشاء كود cryptocurrency.

دعونا ننفذ بعض هذه الخصائص ونرى النتائج.

fake.cryptocurrency_name () "بيتكوين"
fake.cryptocurrency () ("ETC" ، "Ethereum Classic")

يمكنك استخدام خصائص Faker () التالية لإنشاء بيانات وهمية متعلقة بالعملات

العملة () - تنشئ اسم العملة والرمز المقابل لها.

currency_name () - تنشئ اسم العملة.

Currency_code () - يقوم بإنشاء كود العملة.

fake.currency () ("TZS"، "شلن تنزاني")
fake.currency_name () "الليرة التركية"

 

استخدام سطر الأوامر لحزمة الفاكر

بعد تثبيت حزمة Faker ، يمكنك أيضًا استدعائها من سطر الأوامر. يمكنك كتابة الرمز مباشرة في موجه الأوامر.

 

من هم المزودون؟

لقد استخدمنا حتى الآن خصائص منشئ Faker مثل name () ، و first_name ، و last_name ، والعنوان ، وما إلى ذلك. وهناك العديد من هذه الخصائص مجمعة في "مقدمي الخدمات". بعضها مزودون قياسيون بينما البعض الآخر هم موفرو المجتمع الذي طوره المجتمع.

هناك العديد من موفري Standard مثل Credit_card و date_time والإنترنت والشخص والملف الشخصي والبنك وما إلى ذلك مما يساعد في إنشاء البيانات الوهمية ذات الصلة.

يمكنك العثور على مزيد من المعلومات حول القائمة الكاملة لمقدمي الخدمات القياسية وخصائصهم هنا.

هناك العديد من مقدمي خدمات المجتمع مثل نقاط الائتمان ، والسفر الجوي ، والمركبات ، والموسيقى ، والخدمات المصغرة ، وما إلى ذلك. يمكنك أيضًا إنشاء مزود الخدمة الخاص بك وإضافته إلى حزمة Faker.

يمكنك العثور على مزيد من المعلومات حول القائمة الكاملة لمقدمي خدمات المجتمع وممتلكاتهم هنا.

 

كيفية إنشاء بيانات وهمية مترجمة باستخدام Faker Package؟

يمكنك إنشاء البيانات الوهمية المترجمة من خلال توفير الإعدادات المحلية المطلوبة كوسيطة إلى Faker Generator.

كما أنه يدعم عدة لغات. في هذه الحالة ، يجب توفير جميع اللغات في نوع بيانات قائمة Python.

اللغة الافتراضية هي "en_US" أي الإنجليزية الأمريكية.

دعنا نبرمج لإنشاء 10 أسماء هندية.

من faker import Faker fake = Faker ('hi_IN') لـ _ في النطاق (10): print (fake.name ())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगल इन्दु गायकवाड श्री महाराज

 

كيفية إنشاء مجموعة بيانات وهمية باستخدام حزمة Faker؟

سننشئ مجموعة بيانات وهمية من 100 شخص بسمات مثل الوظيفة ، والشركة ، والإقامة ، واسم المستخدم ، والاسم ، والعنوان ، والموقع الحالي ، والبريد ، وما إلى ذلك. سنستخدم "ملفات تعريف الموفر القياسية" لإنشاء هذه البيانات واستخدام Pandas Dataframes لحفظها. هو - هي.

من faker import faker import pandas as pd fake = Faker () profileData = [fake.profile () for i in range (100)] df = pd.DataFrame (profileData) df

 

البيانات الوهمية باستخدام حزمة Faker 1
مصدر الصورة: تم إنشاؤه بواسطة المؤلف

 

 

طرق بديلة لإنشاء بيانات وهمية في بايثون

هناك بعض الطرق الأخرى لإنشاء البيانات الوهمية. وهم على النحو التالي:

  • مصنع

    يمكن استخدامه عندما تحتاج إلى بعض البيانات المزيفة العشوائية مثل السلاسل والأرقام والتواريخ والأوقات وعنوان IP وعناوين البريد الإلكتروني وما إلى ذلك من أجل الاختبار السريع للرمز الخاص بك. يمكنك العثور على مزيد من المعلومات حول هذا الموضوع هنا.

  • استخدام وحدة عشوائية من مكتبة Numpy في بايثون

    إذا كنت تريد فقط أرقامًا شبه عشوائية ، فيمكن إنشاؤها باستخدام الحزمة العشوائية. لها وظائف مختلفة مثل rand () و randint () والاختيار ().

وفي الختام

لقد تعلمنا كيفية استخدام حزمة Faker في Python لإنشاء أنواع مختلفة من البيانات. استكشفنا كيفية إنشاء الأسماء والملفات الشخصية والبيانات المتعلقة بالعملات. تعلمنا أيضًا كيفية إعادة إنتاج نفس البيانات الوهمية وكذلك كيفية إنشاء البيانات الفريدة. استكشفنا الموفرين وتعلمنا أيضًا أنه من الممكن إنشاء بيانات خاصة بالإعدادات المحلية.

هناك الكثير الذي يمكننا القيام به مع هذه الحزمة. لقد شاركت بعض الأمثلة على إنشاء بيانات مزيفة. آمل أن يكون مفيدًا لاختبار تطبيقك وتقليل النفقات العامة للعثور على بيانات حقيقية.

 

المراجع:

لمزيد من المعلومات حول باقة الفاكر ، يمكنك زيارة هنا.

الوسائط الموضحة في هذه المقالة ليست مملوكة لشركة Analytics Vidhya ويتم استخدامها وفقًا لتقدير المؤلف.

أفلاطون. Web3 مُعاد تصوره. تضخيم ذكاء البيانات.
انقر هنا للوصول.

المصدر: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة

الدردشة معنا

أهلاً! كيف يمكنني مساعدك؟