제퍼넷 로고

Excel의 예측 모델링 – 스크래치에서 선형 회귀 모델을 만드는 방법

시간


살펴보기

  • 몇 단계만으로 Excel에서 예측 모델링을 수행 할 수 있습니다.
  • 다음은 Excel에서 선형 회귀 모델을 작성하는 방법과 결과를 해석하는 방법에 대한 단계별 자습서입니다.

개요

예측 모델링을위한 Excel? 정말?

그것은 일반적으로 내가 주제를 제기 할 때 얻는 첫 번째 반응입니다. Excel의 유연한 특성을 활용하여 데이터 과학 및 분석 프로젝트를위한 예측 모델을 구축하는 방법을 보여줄 때 놀라운 모습이 이어집니다.

질문을하겠습니다. 주변 상점에서 고객 데이터 수집을 시작한 경우, 제품을 판매하기 위해 데이터 기반 전략을 채택 할 수 있습니까? 판매를 예측하거나 판매 할 수있는 제품 수를 추정 할 수 있습니까?

이제 세상에서 어떻게 이런 것들을 예측할 수있는 복잡한 통계 모델을 만들지 궁금해 할 것입니다. 분석을 배우거나 분석가를 고용하는 것은 그 범위를 벗어납니다. 다음은 좋은 소식입니다. 필요하지 않습니다. Microsoft Excel은 대부분의 사람들의 머리 위로 날아가는 복잡한 코드를 작성하지 않고도 예측 모델을 구체화 할 수있는 기능을 제공합니다.

우리는 몇 가지 간단한 단계로 분석을 수행하는 데 도움이되는 선형 회귀와 같은 간단한 모델을 MS Excel에서 쉽게 작성할 수 있습니다. 또한 예측 모델링을 수행하기 위해 Excel 또는 Statistics의 마스터 일 필요는 없습니다!

이 기사에서는 Excel에서 선형 회귀 모델을 작성하는 방법과 결과를 분석하여 슈퍼 스타 분석가가 될 수있는 방법을 설명합니다!

이 기사는 Excel for Analysts 시리즈의 XNUMX 번째 기사입니다. 보다 효율적인 분석가가 되려면 이전 기사를 살펴 보는 것이 좋습니다.

Excel 및 Business Analytics 초보자 인 경우 아래 리소스를 확인하시기 바랍니다.

차례

  1. 선형 회귀는 무엇입니까?
  2. Excel에서 가장 중요한 Add Analytics ToolPak 얻기
  3. Excel에서 선형 회귀 구현
  4. 예측 모델의 결과 해석
  5. 모델을 어떻게 개선 할 수 있습니까?
  6. Excel에서 예측하기!

선형 회귀는 무엇입니까?

선형 회귀는 우리 대부분이 배우는 첫 번째 기계 학습 기술입니다. 또한 업계에서 가장 일반적으로 사용되는지도 학습 기술입니다.

그러나 선형 회귀는 무엇입니까?

종속 변수 (예측하려는 변수)와 독립 변수 (예측에 사용되는 요인) 간의 관계를 통계적으로 모델링하는 선형 접근 방식입니다. 선형 회귀는 다음과 같은 방정식을 제공합니다.

여기서 우리는 종속 변수로 Y를, X는 독립 변수이며, 모든 C는 계수입니다. 계수는 기본적으로 중요도에 따라 기능에 할당 된 가중치입니다.

회귀를 수행하는 가장 일반적인 방법은 OLS (Ordinary Least Squares)입니다. 목표는 다음과 같이 가장 적합한 선을 만들기 위해 제곱합을 줄이는 것입니다.

선형 회귀에 대한 자세한 내용은 다음 자료를 참조하십시오.

중요한 분석 툴팩 엑셀 추가 기능 얻기

Excel에서 회귀 분석을 수행하려면 먼저 Excel의 회귀 분석을 활성화해야합니다. 분석 툴팩 애드 인. Excel의 분석 도구는 통계 및 엔지니어링 분석을위한 데이터 분석 도구를 제공하는 추가 프로그램입니다.

통합 문서에 추가하려면 다음 단계를 수행하십시오.

1 단계 – Excel 옵션

We Buy Orders 신청서를 클릭하세요. 파일 -> 옵션 :

2 단계 – Analytics ToolPak 찾기

We Buy Orders 신청서를 클릭하세요. 추가 기능 왼쪽 패널-> Excel 추가 기능 관리 -> Go:

3 단계 – 분석 툴팩 추가

"분석 도구"를 누르고 OK:

Excel에서 Analysis ToolPak을 성공적으로 추가했습니다! 당신은로 이동하여 그것을 확인할 수 있습니다 Data 리본에 바.

Excel에서 예측 모델을 작성해 봅시다!

Excel에서 선형 회귀 구현

지금까지 많은 것들이 이론적이었습니다. 이제 Excel에 대해 자세히 알아보고 선형 회귀 분석을 수행하십시오!

다음은 우리가 다루게 될 문제 설명입니다.

Winden시에는 신발 판매 회사가 있습니다. 회사는 다음과 같은 요소를 고려하여 각 고객을 통한 매출을 예측하려고합니다. – 고객의 수입, 매장과의 거리, 주당 운영 빈도.

1 단계 – 회귀 선택

We Buy Orders 신청서를 클릭하세요. Data -> 데이터 분석:

Data ToolPak에서 데이터 분석으로 이동하여 회귀를 선택한 후 OK:

2 단계 – 옵션 선택

이 단계에서는 다음과 같이 분석에 필요한 몇 가지 옵션을 선택합니다.

  • 입력 y 범위 – 독립 계수의 범위
  • 입력 x 범위 – 종속 요인의 범위
  • 출력 범위 – 결과를 표시하려는 셀 범위

다른 옵션은 임의적이며 특정 목적에 따라 선택할 수 있습니다.

PR 기사 OK 마지막으로 두 단계만으로 Excel에서 회귀 분석을 수행했습니다! 쉽지 않습니까? 이제 회귀 분석 결과를 Excel에서 볼 수 있습니다.

Excel에서 예측 모델의 결과 분석

선형 회귀 모델을 구현하는 것이 쉬운 부분이었습니다. 이제 예측 모델의 결과를 Excel에서 해석하는 까다로운 분석 측면이 제공됩니다.

요약하자면, 우리는 3 가지 유형의 출력을 가지고 있으며 하나씩 하나씩 다룰 것입니다.

  • 회귀 통계표
  • 분산 분석표
  • 회귀 계수 테이블
  • 잔여 테이블

회귀 통계표

회귀 통계표는 최적 선이 독립 변수와 종속 변수 간의 선형 관계를 얼마나 잘 정의하는지 알려줍니다. 가장 중요한 측정 값 중 두 가지는 R 제곱 및 조정 된 R 제곱 값입니다.

XNUMXD덴탈의 R-제​​곱 통계는 적합도 가장 적합한 선으로 얼마나 많은 분산이 설명되어 있는지 알려줍니다. R- 제곱 값의 범위는 0에서 1입니다. 우리의 경우 R- 제곱 값이 0.953입니다. 이는 우리 선이 분산의 95 %를 설명 할 수 있음을 의미합니다.

그러나 문제가 있습니다. 변수를 계속 추가할수록 변수에 영향을 미치지 않더라도 R 제곱 값이 계속 증가합니다. 조정 된 R 제곱 이 문제를 해결하고 훨씬 더 안정적인 측정 항목입니다.

분산 분석표

분산 분석은 분산 분석을 나타냅니다. 이 표는 모형의 변동성에 대한 세부 사항을 제공하기 위해 제곱합을 구성 요소로 세분화합니다.

여기에는 매우 중요한 측정 항목이 포함되며 의의 F (또는 P 값)을 사용하면 모형이 통계적으로 유의한지 여부를 알 수 있습니다. 간단히 말해, 결과는 임의성 때문이 아니라 근본적인 원인 때문일 수 있습니다. p- 값에 가장 많이 사용되는 임계 값은 0.05입니다. 우리가 이것보다 작은 가치를 얻는다면, 우리는 가기보다 좋습니다. 그렇지 않으면, 다른 독립 변수 세트를 선택해야합니다.

이 경우 임계 값이 0.05보다 훨씬 낮은 값이 있습니다. 굉장히 앞으로 나아갈 수 있습니다!

회귀 계수 표

계수 표는 회귀선의 성분 0을 계수 형태로 분류합니다. 우리는 이것들로부터 많은 것을 이해할 수 있습니다.

Winden 신발 회사의 경우 각 단위의 증가가 수입, 판매가 0.08 단위 증가하고 XNUMX 단위 증가 상점으로부터의 거리 508만큼 증가합니다!

증가하는 것 같습니다 실행 빈도 판매량을 24 개 줄 였지만 실제로이 기능을 믿을 수 있습니까? 위의 이미지를 보면 p- 값이 0.5보다 크다는 것을 알 수 있습니다. 이는 통계적으로 유의하지 않습니다. 다음 섹션에서이 상황을 어떻게 처리 할 수 ​​있는지 살펴 보겠습니다.

잔여 테이블

잔차 테이블은 예측 값이 실제 값과 얼마나 다른지 반영합니다. 모델에서 예측 한 값으로 구성됩니다.

모델을 어떻게 개선 할 수 있습니까?

앞에서 보았 듯이 변수의 p- 값 실행 빈도 이 0.05보다 크므로 분석에서이 변수를 제거하여 결과를 확인하겠습니다.

위에서 언급 한 모든 단계를 따르지만 실행 빈도 열은 포함하지 않습니다.

조정 된 R- 제곱의 값이 0.920에서 0.929로 약간 개선되었습니다!

Excel에서 예측하기!

회귀 분석이 준비되었으므로 지금 무엇을 할 수 있습니까? 보자

Aleksander라는 당신의 오래된 고객이 들어서고 우리는 그로부터의 판매를 예측하고 싶습니다. 선형 회귀 모델의 데이터에서 간단히 숫자를 꽂을 수 있습니다.

Aleksander의 수입은 40k이며 매장에서 2km 떨어져 있습니다. 예상 판매량은 얼마입니까?

방정식은 다음과 같습니다.

여기서 우리 모델은 Aleksander가 새 신발 한 켤레를 사기 위해 4218 대를 지불 할 것으로 추정했습니다! 이것이 바로 Microsoft Excel에서 수행 된 선형 회귀의 힘입니다.

최종 메모

이 기사에서는 Excel에서 선형 회귀 모델을 작성하는 방법과 결과를 해석하는 방법을 배웠습니다. 이 안내서가 분석가 또는 데이터 과학자로서 더 나은 사람이 되길 바랍니다.

Analytics ToolPak은 Excel에서 다양한 다른 분석 옵션으로 구성됩니다. 일상 생활에서 다른 많은 통계 분석을 시도 할 수 있습니다!

모바일 APP에서이 기사를 읽을 수도 있습니다. Google Play에서 그것을 얻을

관련 기사

출처 : https://www.analyticsvidhya.com/blog/2020/06/predictive-modeling-excel-linear-regression/

spot_img

최신 인텔리전스

spot_img