제퍼넷 로고

통신 회사의 이탈 분석

시간

개요

이탈 분석이란 무엇입니까? 그리고 통신 회사는 일상 활동에서 이 분석을 어떻게 효과적으로 사용합니까? 업계 전문가에게 배우기 Sakshi Gujral은 모든 필수 세부 정보를 안내하고 실제로 사용할 때 이탈 분석 결과를 개선하기 위한 몇 가지 팁을 제공합니다. 

[포함 된 콘텐츠]

연사 소개: Sakshi Gujral은 현재 Concentrix에서 데이터 과학자로 일하고 있습니다. 그녀는 또한 그녀의 박사 학위를 추구하고 있습니다. IIIT-델리에서. Sakshi는 GATE Scholar 및 UGC-NET 한정자이자 국방 연구 개발 기구의 졸업생입니다. 그녀는 TCS 및 Genpact와 같은 산업 분야에서 5년의 경험을 가지고 있으며 금융, 의료 및 통신 사용 사례 영역에서 데이터 과학 문제를 해결합니다. Sakshi는 기계 학습, NLP, 사물 인터넷 분야에서 연구 작업을 수행했습니다.

Sakshi와 연결 Linkedin.

차례

  1. 이탈 분석: 통신 산업
  2. 이탈 분석이란 무엇입니까?
  3. 데이터 과학 및 분석을 사용하여 이탈 분석
  4. 광범위한 탐색적 데이터 분석
  5. 데이터 세트 토론
  6. 실습 Python 노트북
  7. 결론

이탈 분석: 통신 산업

고객 유지는 기업이 성장과 효과적인 업무 전략을 분석하는 데 중요합니다. 이 DataHour에서 Sakshi는 특히 Telcos에서 이탈로 인한 비즈니스 저하를 구성하는 요인에 대해 논의할 것입니다.

이탈 분석이란 무엇입니까?

쉬운 용어로 이해하기 위해 소매점에서 식료품을 구입했던 Rahul이라는 소년이 있다고 가정합니다. 그러나 요즘 Rahul은 온라인 상점에서 식료품을 주문합니다. Rahul은 소매점에서 온라인 상점으로 전환했습니다. 따라서 Rahul은 소매점의 "이동"입니다. X 회사의 서비스를 사용하던 사람이 갑자기 사용을 중단하고 다른 서비스 제공 회사 Y로 이동하면 그 사람을 X 회사의 Churn이라고 합니다. 이유는 더 많은 혜택, 더 나은 옵션, 접근 가능한 고객 관리 서비스, 더. 이탈 분석은 이러한 모든 문제를 파악하는 데 도움이 됩니다.

회사가 높은 곳에 직면할 때 이탈 분석 그러면 결국 회사의 수익이 감소합니다. 회사의 주식 시장 가치에도 영향을 미칩니다. 이로 인해 회사는 브랜드 가치를 상실하게 되며, 이는 정리해고의 주요 원인이 된다.

지난 몇 년 동안 수백만 명의 사람들이 무료 데이터 및 통화 서비스를 제공하는 특정 통신 회사로 이동했다는 사실을 알고 계실 것입니다. 손쉬운 온라인 신청과 가까운 시뮬레이션 배달로 인해 사람들은 더 나은 경험을 위해 서비스 제공업체를 자주 포팅합니다.

따라서 파산하기 전에 비즈니스 전략을 개선하기 위해 이탈률을 관리하는 것이 필요합니다.

이탈 분석이 막대한 영향을 미치는 회사는 통신, 게임 산업, 지역 상점, 레스토랑, 은행, 쇼핑몰 등

데이터 과학 및 분석을 사용하여 이탈 분석

이제 데이터 과학 및 분석 관점에서 이 문제를 이해할 것입니다.

  1. 데이터 세트 조달 및 이해: 먼저 이탈을 분석하는 데 도움이 되는 모든 기능을 포함하는 디지털화된 형태의 완전한 데이터가 필요합니다. 이를 위해 표준 데이터 세트와 함께 파이썬 코드를 사용하여 특히 통신 부문에서 청크 데이터가 어떻게 보여야 하는지에 대한 개요를 얻는 데 도움이 됩니다.
  2. 보강 및 준비 중인 데이터: 실시간 시나리오에서는 항상 매우 지저분한 형태로 데이터를 수신합니다. 따라서 먼저 우리가 쉽게 이해할 수 있도록 내용을 풍부하게 하고 준비해야 합니다.
  3. 탐색 적 데이터 분석: 분석이란 데이터 속에 숨겨진 트렌드를 찾는 것입니다.
  4. 데이터 세트의 불균형 처리: 종종 데이터 세트에서 불균형을 볼 수 있습니다. 특정 고객 클래스 또는 그룹의 편향된 특성으로 인해 발생할 수 있습니다.
  5. 모델링 수행: 우리는 더 나은 이해를 위해 머신 러닝과 딥 러닝 모델링을 사용할 것입니다.
  6. 결과 평가 및 분석: 마지막으로 위의 프로세스에서 얻은 결과를 평가합니다.

데이터 세트 설명: 이번 프로젝트에서 사용할 데이터셋은 "IBM Telco Churn Dataset"입니다. 가상 통신 회사의 고객 특성을 나타내는 33개의 독립 변수(Independent Variables)가 있습니다. 이탈 열(응답 변수)은 고객이 지난 달에 떠났는지 여부를 나타냅니다. 클래스 'NO'는 지난 몇 달 동안 회사를 떠나지 않은 클라이언트를 나타냅니다. Class 'YES'는 지난 몇 개월 동안 회사를 떠난 고객을 나타냅니다.

아래는 Sakshi가 오늘 프로젝트를 위해 준비한 파이썬 노트북입니다. 다음은 Telco Churn 엑셀입니다. 33개의 열을 볼 수 있습니다.

 아래는 이름별로 모든 열의 그림입니다. 별도로 이해할 것입니다. 이러한 모든 다른 매개 변수는 이탈을 이해하는 데 도움이 됩니다.

프로젝트

이제 대상 열은 아래 스크린샷과 같이 "Churn Label"입니다. 앞에서 설명한 대로 YES 또는 NO입니다. 

이탈 분석

 아래 파이 차트에서 데이터 세트가 "예"에 편향되어 있음을 분명히 알 수 있습니다. 따라서 여기서 클래스 불균형을 처리하는 것이 중요합니다. 여기에서 SMOTE의 도움을 받고 있습니다. SMOTE는 불균형한 데이터 세트를 처리하는 데 도움이 되는 'Synthetic Minority Oversampling Technique'입니다. 따라서 원본 데이터 세트에서 몇 가지 샘플을 더 생성했습니다.

이탈 분석

 광범위한 탐색적 데이터 분석

Python 노트북에서 이미 데이터에 있는 숨겨진 추세는 이후 단계에서 어떤 종류의 기계 학습 모델을 적용해야 하는지 결정하는 데 도움이 됩니다.

다음은 이 프로젝트에서 살펴볼 사항입니다.

이탈 분석

이제 기계 학습 모델을 적용하기 위해 데이터를 보강할 것입니다. 범주형 열과 부동 열의 조합을 적용했습니다. 기계 학습 알고리즘이 빠르게 처리할 수 있는 형식으로 만들어야 합니다. 사전 처리 후 평균 및 표준 편차와 같은 일부 통계 데이터를 꺼냈습니다. 마지막 2개의 컬럼에서 매우 중요한 'CLTV'(고객이 더 오래 유지됨)와 '이탈 이유'를 볼 수 있습니다. 그래서 이 텍스트 데이터에 MP를 적용하여 고객을 다른 회사로 옮기는 트렌드를 찾았습니다. 또한 타사 데이터의 데이터를 분석하여 향후 고객이 떠나지 않도록 제품을 설계할 수 있습니다.

이탈 분석

 아래는 상관 관계입니다. 상관관계가 높은 변수가 1에 가깝다는 것을 분명히 알 수 있습니다. 예를 들어 '총 요금'은 0.93으로, 서비스 요금이 저렴하면 고객이 더 오래 머무를 것임을 나타냅니다. 

이탈 분석

 아래 코드를 사용하여 기계 학습 문제에서 매우 중요한 분포를 연구합니다. 앞으로 어떤 알고리즘을 사용할지 결정하는 데 도움이 됩니다.

이탈 분석

이제 의료 및 범주 값을 분리해야 합니다. 아래에서 성별 분포 측면에서 휘젓는 부분을 명확하게 볼 수 있습니다. 성별 측면에서 이탈은 별 차이가 없다는 결론을 내릴 수 있습니다.

이탈 분석

아래 차트에서 더 많은 기간 동안 계획을 세운 고객이 더 많은 유지율을 보이는 것을 볼 수 있습니다. 그들에게는 이탈률이 훨씬 낮습니다.

프로젝트

아래는 임기가 증가함에 따라 이탈 가능성이 감소한다는 것을 보여주는 흥미로운 차트입니다.

이탈 분석

이 모든 그래프를 통해 우리는 어떤 요인이 더 많은 이탈률에 영향을 미치는지, 어떤 요인이 그렇지 않은지 파악하려고 노력하고 있습니다. 허점을 해결하여 이탈을 줄일 수 있도록; 예를 들어, 우리는 통신사에 할인율이 있는 더 연장된 요금제를 제공하여 해지율을 줄이도록 지시할 수 있습니다. 

마지막 컬럼인 'Churn Reason'에는 NLP의 일부를 적용한 단어 구름 형태의 모든 고객 텍스트를 넣겠습니다. 이탈에 기여하는 모든 이유를 볼 수 있습니다.

이탈 분석

그래프는 우편 번호, 위도, 경도, 재직 기간 등과 함께 이탈 점수 간의 관계를 보여줍니다.

결과: 아래의 스케치북 플롯은 테스트 데이터에서 0과 1 레이블의 분포를 보여줍니다.

결론

분석을 적용하고 분석 정보를 이해함으로써 통신 회사는 계획을 개선하고 이탈자를 줄이는 작업을 수행할 수 있습니다. 호텔, 소매점 및 쇼핑몰과 같은 다른 부문에서도 이 방법을 사용하여 고객이 이탈하는 것을 막을 수 있습니다.

아래는 우리의 테이크 어웨이 위의 분석에서.

  1. 전자 수표 매체는 가장 높은 변동률을 보입니다.
  2. 월간 고객은 계약 조건 없이 이동할 수 있기 때문에 이탈할 가능성이 높습니다.
  3. 온라인 보안을 느끼지 못하고 기술을 얻지 못하는 고객. 가장 높은 이탈률을 지원합니다.
  4. 노인이 아닌 시민이 가장 높은 이탈자입니다.

다음은 또 다른 흥미로운 기사입니다. 기계 학습을 사용한 은행 고객 이탈 예측.

이 기사에 표시된 미디어는 Analytics Vidhya 소유가 아니며 발표자의 프레젠테이션에서 사용됩니다.

spot_img

최신 인텔리전스

spot_img