제퍼넷 로고

Faker 패키지를 사용하여 Python에서 더미 데이터를 만드는 방법

시간

이 기사는 데이터 과학 Blogathon

더미 데이터는 다양한 목적을 위해 필요합니다. 특정 형식으로 필요한 데이터를 찾는 것은 어려울 수 있습니다. 이 기사는 Faker 패키지를 사용하여 더미 데이터를 생성하는 다양한 방법을 탐구합니다. Python.

이 문서에서 다루는 주제는 다음과 같습니다.

  • 더미 데이터 란 무엇입니까?
  • 더미 데이터가 필요한 이유는 무엇입니까?
  • Faker 패키지는 어떻게 설치하나요?
  • Faker Generator를 생성하고 초기화하는 방법은 무엇입니까?
  • Faker를 사용하여 이름, 주소 및 임의의 텍스트를 만드는 방법은 무엇입니까?
  • 동일한 더미 데이터를 생성하는 방법은 무엇입니까?
  • 고유한 더미 데이터를 만드는 방법은 무엇입니까?
  • Faker를 사용하여 통화 관련 더미 데이터를 만드는 방법은 무엇입니까?
  • Faker를 사용하여 현지화된 더미 데이터를 만드는 방법은 무엇입니까?
  • Faker를 사용하여 더미 데이터 세트를 만드는 방법은 무엇입니까?
  • 공급자란 무엇입니까?
  • Faker 패키지의 명령줄 사용
  • Python에서 더미 데이터를 생성하는 다른 방법

 

더미 데이터란 무엇입니까?

더미 데이터는 랜덤 데이터라고도 합니다. 이름에서 알 수 있듯이 무작위로 생성되는 가짜 데이터입니다. 라이브 데이터의 대체 또는 자리 표시자 역할을 합니다.

 

더미 데이터가 필요한 이유는 무엇입니까?

더미 데이터는 테스트 및 운영 목적으로 사용됩니다. 개발한 내용과 코드가 다양한 종류의 입력에 반응하는 방식을 테스트하는 데 사용됩니다.

Python에서는 Faker 패키지를 사용하여 더미 데이터를 생성할 수 있습니다. 다양한 유형의 더미 데이터를 생성하는 오픈 소스 라이브러리입니다.

 

더미 데이터용 Faker 패키지를 설치하는 방법은 무엇입니까?

다음과 같이 pip 명령을 사용하여 Faker 패키지를 설치할 수 있습니다.

핍 설치 Faker

 

Faker Generator를 만들고 초기화하는 방법은 무엇입니까?

Faker() 메서드를 사용하여 Faker Generator를 만들고 초기화할 수 있습니다.

from faker import Faker 가짜 = Faker()

이제 Faker 생성기의 설치 및 초기화가 준비되었으므로 원하는 데이터를 생성할 수 있습니다.

 

Faker를 사용하여 이름, 주소 및 임의의 텍스트를 만드는 방법은 무엇입니까?

name() 메서드를 사용하여 전체 이름을 만들 수 있습니다. 전체 이름 대신에 유일한 이름이나 성을 원하는 경우 first_name() 및 last_name() 메서드를 사용할 수 있습니다.

이러한 메서드를 호출할 때마다 임의의 이름이 생성됩니다.

이러한 메서드가 어떻게 작동하는지 알아보기 위해 코드로 이동해 보겠습니다.

fake.first_name() '대니'
fake.last_name() '라일리' 
fake.name() '존 마르티네즈'

주소 및 임의의 텍스트를 생성하기 위해 address() 및 text() 메서드를 사용할 수 있습니다.

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() '게임 트레이드가 다릅니다. 프로그램 사이에 있을 수 있습니다. 백만 농산물은 두 가지 모두를 따라 작게 믿습니다.nCost 최고의 주는 자본 당국에 알려줍니다. 먼 저녁 내 안에 음식 소원. 단순한 플라이 브레이크 경력일 수도 있습니다.'

위의 text() 메서드는 단일 단락을 생성했습니다.

여러 이름을 만들려면 다음과 같이 for 루프에 name() 메서드를 넣을 수 있습니다.

for _ in range(10): print(fake.name())

마리사 발렌시아 DDS 박사
제시카 버드
안나 멘데즈
제시카 로버트슨
마빈 던컨
로버트 굿
바바라 잭슨
제임스 포크너
데스티니 하비
크리스틴 휴즈


 

Faker 패키지를 사용하여 동일한 더미 데이터를 만드는 방법은 무엇입니까?

경우에 따라 동일한 데이터 세트를 재현할 수 있습니다. 발전기를 시딩하면 가능합니다. seed() 메서드를 사용하여 다음과 같이 동일한 더미 데이터를 생성할 수 있습니다.

Faker.seed(111) print(fake.first_name())
'크리스티 벤더'

 

Faker 패키지를 사용하여 고유한 더미 데이터를 만드는 방법은 무엇입니까?

생성된 더미 데이터가 고유한지 확인하기 위해 생성기의 .unique 속성을 사용할 수 있습니다.

이름 = [fake.unique.first_name() for
 i in 범위(100)]

위의 코드가 실행될 때마다 고유한 100개의 이름이 생성됩니다.

 

Faker 패키지를 사용하여 통화 관련 더미 데이터를 만드는 방법은 무엇입니까?

암호화폐 관련 더미 데이터를 생성하기 위해 다음 Faker() 속성을 사용할 수 있습니다.

암호 화폐() – 암호 화폐 이름과 해당 코드를 생성합니다.

cryptocurrency_name() - 암호 화폐 이름을 생성합니다.

cryptocurrency_code() - 암호 화폐 코드를 생성합니다.

이러한 속성 중 일부를 구현하고 결과를 살펴보겠습니다.

fake.cryptocurrency_name() '비트코인'
fake.cryptocurrency() ('ETC', '이더리움 클래식')

통화 관련 더미 데이터를 생성하기 위해 다음 Faker() 속성을 사용할 수 있습니다.

Currency() – 통화 이름과 해당 코드를 생성합니다.

Currency_name() – 통화 이름을 생성합니다.

Currency_code() – 통화 코드를 생성합니다.

fake.currency() ('TZS', '탄자니아 실링')
fake.currency_name() '터키 리라'

 

Faker 패키지의 명령줄 사용

Faker 패키지를 설치한 후 명령줄에서 호출할 수도 있습니다. 명령 프롬프트에서 코드를 직접 작성할 수 있습니다.

 

공급자란 무엇입니까?

지금까지 name(), first_name, last_name, address 등과 같은 Faker 생성기 속성을 사용했습니다. 이러한 속성은 'Providers'에 패키지로 많이 있습니다. 일부는 표준 제공자이고 다른 일부는 커뮤니티에서 개발한 커뮤니티 제공자입니다.

관련 더미 데이터를 생성하는 데 도움이 되는 credit_card, date_time, 인터넷, 사람, 프로필, 은행 등과 같은 많은 표준 공급자가 있습니다.

표준 공급자 및 해당 속성의 전체 목록에 대한 자세한 정보를 찾을 수 있습니다. 여기에서 지금 확인해 보세요..

신용 점수, 항공 여행, 차량, 음악, 마이크로서비스 등과 같은 많은 커뮤니티 제공자가 있습니다. 제공자를 생성하여 Faker 패키지에 추가할 수도 있습니다.

커뮤니티 공급자 및 해당 속성의 전체 목록에 대한 자세한 정보를 찾을 수 있습니다. 여기에서 지금 확인해 보세요..

 

Faker 패키지를 사용하여 현지화된 더미 데이터를 만드는 방법은 무엇입니까?

Faker Generator에 필요한 로케일을 인수로 제공하여 현지화된 더미 데이터를 생성할 수 있습니다.

또한 여러 로케일을 지원합니다. 이 경우 모든 로케일을 python 목록 데이터 유형으로 제공해야 합니다.

기본 로케일은 'en_US', 즉 미국 영어입니다.

10개의 힌디어 이름을 만드는 코드를 작성해 보겠습니다.

from faker import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगल इन्दु गायकवाड श्री महाराज

 

Faker 패키지를 사용하여 더미 데이터 세트를 만드는 방법은 무엇입니까?

직업, 회사, 거주지, 사용자 이름, 이름, 주소, 현재 위치, 메일 등과 같은 속성을 가진 100명의 더미 데이터 세트를 생성합니다. 표준 공급자 '프로필'을 사용하여 이 데이터를 생성하고 Pandas Dataframe을 사용하여 저장합니다. 그것.

페이커에서 가져오기 페이커에서 팬더를 pd로 가져오기 fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Faker 패키지 1을 사용한 더미 데이터
이미지 출처: 작성자 작성

 

 

Python에서 더미 데이터를 생성하는 다른 방법

더미 데이터를 만드는 몇 가지 다른 방법이 있습니다. 그것들은 다음과 같습니다:

  • 가짜 공장

    코드의 빠른 테스트를 위해 문자열, 숫자, 날짜, 시간, IP, 이메일 주소 등과 같은 임의의 가짜 데이터가 필요할 때 사용할 수 있습니다. 당신은 그것에 대해 더 많은 정보를 찾을 수 있습니다 여기에서 지금 확인해 보세요..

  • Python에서 Numpy 라이브러리의 Random 모듈 사용

    의사 난수만 원하는 경우 random 패키지를 사용하여 생성할 수 있습니다. rand(), randint() 및 choice()와 같은 다양한 기능이 있습니다.

결론

Python에서 Faker 패키지를 사용하여 다양한 유형의 데이터를 생성하는 방법을 배웠습니다. 이름, 개인 프로필, 통화 관련 데이터를 만드는 방법을 살펴보았습니다. 또한 동일한 더미 데이터를 재현하는 방법과 고유한 데이터를 생성하는 방법도 배웠습니다. 우리는 공급자를 탐색했고 또한 로케일별 데이터를 생성하는 것이 가능하다는 것을 배웠습니다.

이 패키지로 할 수 있는 일이 더 많습니다. 나는 가짜 데이터를 생성하는 몇 가지 예를 공유했습니다. 응용 프로그램을 테스트하고 실제 데이터를 찾는 오버헤드를 줄이는 데 유용하기를 바랍니다.

 

참조 :

Faker 패키지에 대한 자세한 내용은 다음을 방문하십시오. 여기에서 지금 확인해 보세요..

이 기사에 표시된 미디어는 Analytics Vidhya의 소유가 아니며 작성자의 재량에 따라 사용됩니다.

PlatoAi. Web3 재창조. 데이터 인텔리전스 증폭.
액세스하려면 여기를 클릭하십시오.

출처: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?