Hoe dummy-gegevens in Python te maken met behulp van Faker-pakket

Dit artikel is gepubliceerd als onderdeel van het Data Science-blogathon

Dummy-gegevens zijn nodig voor verschillende doeleinden. Het kan moeilijk zijn om de vereiste gegevens in een specifiek formaat te vinden. Dit artikel onderzoekt de verschillende manieren om de dummy-gegevens te maken met behulp van het Faker-pakket in Python.

Onderwerpen die in dit artikel aan bod komen zijn als volgt:

Wat zijn dummygegevens?
Waarom hebben we dummy-gegevens nodig?
Hoe installeer ik het Faker-pakket?
Hoe maak en initialiseer je een Faker Generator?
Hoe maak je een naam, adres en willekeurige tekst aan met Faker?
Hoe maak je dezelfde dummy-gegevens aan?
Hoe maak je unieke dummy data aan?
Hoe valuta-gerelateerde dummy-gegevens maken met behulp van Faker?
Hoe gelokaliseerde dummy-gegevens maken met behulp van Faker?
Hoe maak je een dummy-dataset met Faker?
Wat zijn aanbieders?
Command-line gebruik van Faker Package
Alternatieve manieren om dummy-gegevens te maken in Python

Wat zijn dummygegevens?

Dummy-gegevens worden ook wel willekeurige gegevens genoemd. Zoals de naam al doet vermoeden, zijn het nepgegevens die willekeurig worden gegenereerd. Het fungeert als een vervanging of tijdelijke aanduiding voor de live gegevens.

Waarom hebben we dummy-gegevens nodig?

Dummy-gegevens worden gebruikt voor test- en operationele doeleinden. Het wordt gebruikt om te testen wat u hebt ontwikkeld en hoe uw code reageert op verschillende soorten invoer.

In Python kan men de dummy-gegevens maken met behulp van het Faker-pakket. Het is een open-sourcebibliotheek die dummy-gegevens van veel verschillende typen genereert.

Hoe installeer ik het Faker-pakket voor dummy-gegevens?

Men kan het Faker-pakket als volgt installeren met behulp van het pip-commando:

Pip installeer Faker

Hoe maak en initialiseer je een Faker Generator?

Men kan de methode Faker() gebruiken om een Faker Generator te maken en te initialiseren.

van faker importeer Faker nep = Faker()

Nu u klaar bent met uw installatie en initialisatie van een Faker-generator, kunt u alle gewenste gegevens maken.

Hoe maak je een naam, adres en willekeurige tekst aan met behulp van Faker?

De methode name() kan worden gebruikt om een volledige naam te maken. Als u alleen de voornaam of achternaam wilt in plaats van de volledige naam, kunt u de methoden first_name() en last_name() gebruiken.

Elke aanroep van deze methoden genereert een willekeurige naam.

Laten we in de code springen om te zien hoe deze methoden werken.

nep.first_name() 'Danny'

nep.last_name() 'Riley'

fake.name() 'John Martinez'

Voor het maken van adres en willekeurige tekst kunt u de methoden address() en text() gebruiken.

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'

fake.text() 'Spel verhandelt hij anders. Er kan tussen programma. Miljoenen producten geloven klein langs beide.nKosten beste week vertellen kapitaalautoriteit. Eten wens binnen verre avond mijn. Simpele vliegvakantie-carrière misschien.'

De methode text() hierboven heeft een enkele alinea gemaakt.

Als u meerdere namen wilt maken, kunt u de methode name() als volgt in een for-lus plaatsen:

voor _ in bereik(10): print(fake.name())

Dr Marissa Valencia DDS
Jessica Byrd
Anna Mendez
Jessica Robertson
Marvin Duncan
Rob Goed
Barbara Jackson
James Faulkner
Het lot Harvey
Christine Hughes

Hoe dezelfde dummy-gegevens maken met behulp van het Faker-pakket?

In sommige gevallen wilt u misschien dezelfde dataset reproduceren. Het is mogelijk door de generator te seeding. U kunt de methode seed() gebruiken om dezelfde dummy-gegevens als volgt te produceren:

Faker.seed(111) print(fake.first_name())
'Christy Bender'

Hoe unieke dummy-gegevens maken met behulp van het Faker-pakket?

Om ervoor te zorgen dat de gegenereerde dummy-gegevens uniek zijn, kunt u de eigenschap .unique van de generator gebruiken.

namen = [nep.uniek.voornaam() For i in bereik(100)]

Elke keer dat de bovenstaande code wordt uitgevoerd, genereert deze 100 unieke namen.

Hoe valutagerelateerde dummy-gegevens te creëren met behulp van het Faker-pakket?

U kunt de volgende Faker()-eigenschappen gebruiken voor het maken van dummy-gegevens over cryptocurrency:

cryptocurrency() – Het creëert de naam van de cryptocurrency en de bijbehorende code.

cryptocurrency_name() - Het creëert een cryptocurrency-naam.

cryptocurrency_code() - Het creëert cryptocurrency-code.

Laten we enkele van deze eigenschappen implementeren en de resultaten bekijken.

nep.cryptocurrency_name() 'Bitcoin'

nep.cryptocurrency() ('ETC', 'Ethereum Classic')

U kunt de volgende eigenschappen van Faker() gebruiken om valutagerelateerde dummygegevens te maken:

valuta() – Het creëert een valutanaam en de bijbehorende code.

currency_name() – Het creëert een valutanaam.

currency_code() – Het creëert een valutacode.

fake.currency() ('TZS', 'Tanzaniaanse shilling')

fake.currency_name() 'Turkse lira'

Opdrachtregelgebruik van Faker-pakket

Na installatie van het Faker-pakket, kunt u het ook vanaf de opdrachtregel aanroepen. U kunt de code direct achter de opdrachtprompt schrijven.

Wat zijn aanbieders?

Tot nu toe hebben we eigenschappen van de Faker-generator gebruikt, zoals naam(), voornaam, achternaam, adres, enz. Er zijn veel van dergelijke eigenschappen verpakt in 'Providers'. Sommige zijn standaardproviders, terwijl andere communityproviders zijn die door de community zijn ontwikkeld.

Er zijn veel standaardaanbieders zoals creditcard, datum_tijd, internet, persoon, profiel, bank, enz. Die helpen bij het maken van de relevante dummy-gegevens.

U kunt meer informatie vinden over de volledige lijst van Standaardaanbieders en hun eigenschappen hier.

Er zijn veel Community Providers zoals Credit Score, Air Travel, Vehicle, Music, Microservice, etc. U kunt ook uw provider aanmaken en deze toevoegen aan het Faker-pakket.

U kunt meer informatie vinden over de volledige lijst van Community Providers en hun eigenschappen hier.

Hoe gelokaliseerde dummy-gegevens maken met behulp van het Faker-pakket?

U kunt de gelokaliseerde dummy-gegevens maken door de vereiste landinstelling als argument aan de Faker Generator te verstrekken.

Het ondersteunt ook meerdere landinstellingen. In dat geval moeten alle landinstellingen worden opgegeven in het gegevenstype Python-lijst.

De standaardtaal is 'en_US', oftewel Amerikaans Engels.

Laten we coderen om 10 Hindi-namen te maken.

from faker import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())

अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगल इन्दु गायकवाड श्री महाराज

Hoe maak je een dummy-dataset aan met behulp van een Faker-pakket?

We zullen een dummy-gegevensset van 100 mensen maken met kenmerken zoals baan, bedrijf, woonplaats, gebruikersnaam, naam, adres, huidige locatie, e-mail, enz. We zullen de 'profielen' van de standaardprovider gebruiken om deze gegevens te creëren en Pandas-dataframes gebruiken om op te slaan het.

from faker import Faker import panda's als pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

Dummy-gegevens met behulp van Faker-pakket 1 — Afbeeldingsbron: gemaakt door auteur

Alternatieve manieren om dummy-gegevens te maken in Python

Er zijn enkele andere manieren om de dummy-gegevens te maken. Ze zijn als volgt:

nepfabriek
Het kan worden gebruikt wanneer je willekeurige nepgegevens nodig hebt, zoals strings, cijfers, datums, tijden, IP, e-mailadressen, enz. voor het snel testen van je code. U kunt er meer informatie over vinden hier.

Willekeurige module uit de Numpy-bibliotheek gebruiken in Python

Als u alleen pseudo-willekeurige getallen wilt, kunnen deze worden gegenereerd met behulp van het willekeurige pakket. Het heeft verschillende functies zoals rand(), randint() en choice().

Conclusie

We hebben geleerd hoe we het Faker-pakket in Python kunnen gebruiken om verschillende soorten gegevens te maken. We hebben onderzocht hoe we namen, persoonlijke profielen en valutagerelateerde gegevens kunnen maken. We hebben ook geleerd hoe we dezelfde dummy-gegevens kunnen reproduceren en hoe we de unieke gegevens kunnen genereren. We hebben de providers verkend en ook geleerd dat het mogelijk is om landspecifieke gegevens te creëren.

We kunnen nog veel meer met dit pakket. Ik heb een paar voorbeelden gedeeld van het genereren van nepgegevens. Ik hoop dat het nuttig zal zijn voor het testen van uw toepassing en het verminderen van de overhead van het vinden van echte gegevens.

Referenties:

Voor meer informatie over het Faker-pakket kunt u terecht op: hier.

De media die in dit artikel worden getoond, zijn geen eigendom van Analytics Vidhya en worden naar goeddunken van de auteur gebruikt.

PlatoAi. Web3 opnieuw uitgevonden. Gegevensintelligentie versterkt.
Klik hier om toegang te krijgen.

Bron: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Generatieve data-intelligentie

Hoe dummy-gegevens in Python te maken met behulp van het Faker-pakket?

Wat zijn dummygegevens?

Waarom hebben we dummy-gegevens nodig?

Hoe installeer ik het Faker-pakket voor dummy-gegevens?

Hoe maak en initialiseer je een Faker Generator?

Hoe maak je een naam, adres en willekeurige tekst aan met behulp van Faker?

Hoe dezelfde dummy-gegevens maken met behulp van het Faker-pakket?

Hoe unieke dummy-gegevens maken met behulp van het Faker-pakket?

Hoe valutagerelateerde dummy-gegevens te creëren met behulp van het Faker-pakket?

Opdrachtregelgebruik van Faker-pakket

Wat zijn aanbieders?

Hoe gelokaliseerde dummy-gegevens maken met behulp van het Faker-pakket?

Hoe maak je een dummy-dataset aan met behulp van een Faker-pakket?

Alternatieve manieren om dummy-gegevens te maken in Python

Conclusie

Referenties:

Bitcoin Bloodbath: Crypto-analist ziet 'Death Cross' na prijsdaling van 8%

AIEMP kondigt lancering aan van innovatief AI-beveiligingsproject

Laatste intelligentie

Pantera Capital's Fund V streeft naar $1 miljard voor diverse Blockchain-investeringen

Het Nationaal Virtueel Klimaatlaboratorium is uw gids voor klimaatwetenschap – CleanTechnica

Deze semi-gesloten elektrische driewieler kan het woon-werkverkeer een stuk leuker maken – CleanTechnica

Methaancompensatieleverancier Zefiro Methaan gaat naar de beurs op Cboe Canada

Zeldzame 'Epic Sat' uit Bitcoin's vierde halveringsblok verkocht voor meer dan $2 miljoen

Litecoin beweegt binnen een bereik vanwege de ambivalentie van handelaren