Logo Zephyrnet

Hiệp phương sai và tương quan: Sự khác biệt là gì?

Ngày:

Mục lục

Trong thống kê, hiệp phương sai và tương quan là hai khái niệm toán học. Cả hai cụm từ đều được sử dụng để mô tả mối quan hệ giữa hai biến. Blog này nói về hiệp phương sai và tương quan: sự khác biệt là gì? Bắt đầu nào!

Giới thiệu

Hiệp phương sai và tương quan là hai khái niệm toán học được sử dụng trong thống kê. Cả hai thuật ngữ đều được sử dụng để mô tả hai biến liên quan với nhau như thế nào. Hiệp phương sai là thước đo mức độ hai biến thay đổi cùng nhau. Các thuật ngữ hiệp phương sai và tương quan rất giống nhau trong lý thuyết xác suất và thống kê. Cả hai thuật ngữ đều mô tả mức độ mà một biến ngẫu nhiên hoặc một tập hợp các biến ngẫu nhiên có thể sai lệch so với giá trị mong đợi. Nhưng sự khác biệt giữa hiệp phương sai và tương quan là gì? Chúng ta hãy hiểu điều này bằng cách đi qua từng điều khoản này.

Nó được tính bằng hiệp phương sai của hai biến chia cho tích của độ lệch chuẩn của chúng. Hiệp phương sai có thể dương, âm hoặc bằng XNUMX. Hiệp phương sai dương có nghĩa là hai biến có xu hướng tăng hoặc giảm cùng nhau. Hiệp phương sai âm có nghĩa là hai biến có xu hướng di chuyển theo hướng ngược nhau.

Hiệp phương sai bằng 1 có nghĩa là hai biến không liên quan. Tương quan chỉ có thể nằm trong khoảng -1 và 1. Tương quan -1 có nghĩa là hai biến có mối tương quan nghịch hoàn toàn, nghĩa là khi một biến tăng thì biến kia giảm. Hệ số tương quan bằng 0 có nghĩa là hai biến có mối tương quan dương hoàn toàn, có nghĩa là khi một biến tăng thì biến kia cũng tăng. Hệ số tương quan bằng XNUMX có nghĩa là hai biến không có liên quan với nhau.

Đóng góp bởi: Deepak Gupta

Sự khác biệt giữa hiệp phương sai và tương quan

Aspect Hiệp phương sai Tương quan
Định nghĩa Đo lường độ biến thiên chung của hai biến ngẫu nhiên. Đo lường cường độ và hướng của mối quan hệ tuyến tính giữa hai biến.
Phạm vi Có thể nhận bất kỳ giá trị nào từ vô cực âm đến vô cực dương. Phạm vi từ -1 đến 1.
Các đơn vị Có đơn vị – tích của đơn vị của hai biến. Không thứ nguyên (không có đơn vị), một thước đo tiêu chuẩn.
Bình thường hóa Không được chuẩn hóa – độ lớn phụ thuộc vào đơn vị của các biến. Chuẩn hóa - độc lập với thang đo của các biến.
Sự giải thích Khó giải thích sức mạnh của mối quan hệ do thiếu sự bình thường hóa. Dễ giải thích vì đây là hệ số chuẩn hóa (thường là Pearson's �r).
Độ nhạy Nhạy cảm với thang đo và đơn vị đo lường của các biến. Không nhạy cảm với thang đo và đơn vị đo vì đây là thước đo tương đối.

Nếu bạn muốn tìm hiểu thêm về Thống kê, việc tham gia một khóa học trực tuyến miễn phí sẽ giúp bạn hiểu các khái niệm cơ bản cần thiết để bắt đầu xây dựng sự nghiệp của mình. Tại Học viện học tập tuyệt vời, chúng tôi cung cấp một Khóa học miễn phí về thống kê cho khoa học dữ liệu. Khóa học chuyên sâu này bắt đầu từ góc nhìn hoàn chỉnh của người mới bắt đầu và giới thiệu cho bạn các khía cạnh khác nhau của thống kê cần thiết để giải quyết nhiều vấn đề về khoa học dữ liệu. Tham gia khóa học này có thể giúp bạn phát triển sự nghiệp khoa học dữ liệu của mình.

In số liệu thống kê, chúng ta thường xuyên gặp hai thuật ngữ này được gọi là hiệp phương sai và tương quan. Hai thuật ngữ này thường được sử dụng thay thế cho nhau. Hai ý tưởng này tương tự nhau, nhưng không giống nhau. Cả hai đều được sử dụng để xác định mối quan hệ tuyến tính và đo lường sự phụ thuộc giữa hai biến ngẫu nhiên. Nhưng chúng có giống nhau không? Không thực sự. 

Mặc dù có những điểm tương đồng giữa các thuật ngữ toán học này, chúng vẫn khác nhau.

Hiệp phương sai là khi hai biến thay đổi với nhau, trong khi Tương quan là khi sự thay đổi của một biến dẫn đến sự thay đổi của một biến khác.

Trong bài viết này, chúng tôi sẽ cố gắng định nghĩa các thuật ngữ ma trận tương quan và hiệp phương sai, nói về hiệp phương sai và tương quan và hiểu ứng dụng của cả hai thuật ngữ.

hiệp phương sai là gì?

Hiệp phương sai biểu thị hướng của mối quan hệ tuyến tính giữa hai biến. Theo hướng chúng tôi muốn nói nếu biến tỉ lệ thuận hoặc tỉ lệ nghịch với nhau. (Việc tăng giá trị của một biến có thể có tác động tích cực hoặc tiêu cực đến giá trị của biến kia).

Các giá trị của hiệp phương sai có thể là số bất kỳ giữa hai vô số đối diện. Ngoài ra, điều quan trọng cần đề cập là hiệp phương sai chỉ đo lường mức độ hai biến thay đổi cùng nhau chứ không đo lường sự phụ thuộc của biến này vào biến khác.

Giá trị hiệp phương sai giữa 2 biến đạt được bằng cách lấy tổng của tích các hiệu từ giá trị trung bình của các biến như sau: 

Giới hạn trên và dưới của hiệp phương sai phụ thuộc vào phương sai của các biến liên quan. Ngược lại, những phương sai này có thể thay đổi theo tỷ lệ của các biến. Ngay cả sự thay đổi về đơn vị đo cũng có thể làm thay đổi hiệp phương sai. Vì vậy, hiệp phương sai chỉ hữu ích để tìm hướng của mối quan hệ giữa hai biến chứ không phải độ lớn. Dưới đây là các đồ thị giúp chúng ta hiểu hiệp phương sai giữa hai biến sẽ diễn ra theo các hướng khác nhau như thế nào.

hiệp phương sai và tương quan

Ví dụ:

X Y
10 40
12 48
14 56
8 32

Bước 1: Tính giá trị trung bình của X và Y 

Giá trị trung bình của X ( μx ) : 10+12+14+8 / 4 = 11 

Giá trị trung bình của Y(μy) = 40+48+56+32 = 44

Bước 2: Thay thế các giá trị trong công thức 

xi –NS yi – ȳ 
10 - 11 = -1  40 – 44 = – 4
12 - 11 = 1 48 – 44 = 4
14 - 11 = 3 56 - 44 = 12
8 - 11 = -3 32 - 44 = 12 

Thay thế các giá trị trên vào công thức 

Cov(x,y) = (-1) (-4) +(1)(4)+(3)(12)+(-3)(12)

                  ___________________________

                                            4 

 Cov(x,y) = 8 / 2 =

Do đó, Co-variance cho dữ liệu trên là 4 

Kiểm tra nhanh - Giới thiệu về Khoa học dữ liệu

Tương quan là gì?

Phân tích tương quan là một phương pháp đánh giá thống kê được sử dụng để nghiên cứu độ mạnh của mối quan hệ giữa hai biến liên tục được đo bằng số.

Nó không chỉ cho thấy loại mối quan hệ (về phương hướng) mà còn cho thấy mối quan hệ đó bền chặt đến mức nào. Vì vậy, chúng ta có thể nói các giá trị tương quan có các khái niệm được tiêu chuẩn hóa, trong khi các giá trị hiệp phương sai không được tiêu chuẩn hóa và không thể được sử dụng để so sánh mức độ mạnh hay yếu của mối quan hệ vì độ lớn không có ý nghĩa trực tiếp. Nó có thể giả định các giá trị từ -1 đến +1. 

Để xác định hiệp phương sai của hai biến lớn hay nhỏ, chúng ta cần đánh giá nó so với độ lệch chuẩn của hai biến. 

Để làm như vậy, chúng ta phải chuẩn hóa hiệp phương sai bằng cách chia nó với tích của độ lệch chuẩn của hai biến, do đó cung cấp mối tương quan giữa hai biến.

Kết quả chính của một mối tương quan được gọi là hệ số tương quan. 

hiệp phương sai và tương quan

Hệ số tương quan là một thước đo không thứ nguyên và giá trị của nó nằm trong khoảng từ -1 đến +1. 

Càng gần +1 hoặc -1 thì hai biến càng có liên quan chặt chẽ với nhau. 

Nếu không có mối quan hệ nào giữa hai biến thì hệ số tương quan chắc chắn sẽ bằng 0. Tuy nhiên, nếu bằng 0 thì chúng ta chỉ có thể nói rằng không có mối quan hệ tuyến tính. Có thể tồn tại các mối quan hệ chức năng khác giữa các biến.

Khi hệ số tương quan dương, sự gia tăng của một biến cũng làm tăng biến kia. Khi hệ số tương quan âm, sự thay đổi của hai biến theo hướng ngược nhau.

Ví dụ: 

X Y
10 40
12 48
14 56
8 32

Bước 1: Tính giá trị trung bình của X và Y 

Giá trị trung bình của X ( μx ) : 10+12+14+8 / 4 = 11 

Giá trị trung bình của Y(μy) = 40+48+56+32/4 = 44

Bước 2: Thay thế các giá trị trong công thức 

xi –NS yi – ȳ 
10 - 11 = -1  40 – 44 = – 4
12 - 11 = 1 48 – 44 = 4
14 - 11 = 3 56 - 44 = 12
8 - 11 = -3 32 - 44 = 12 

Thay thế các giá trị trên vào công thức 

Cov(x,y) = (-1) (-4) +(1)(4)+(3)(12)+(-3)(12)

                  ___________________________

                                            4 

Cov(x,y) = 8 / 2 =

Do đó, Co-variance cho dữ liệu trên là 4 

Bước 3: Bây giờ thay thế câu trả lời thu được vào công thức Tương quan  

hiệp phương sai và tương quan

Trước khi thay thế chúng ta phải tìm độ lệch chuẩn của x và y 

Hãy lấy dữ liệu cho X như được đề cập trong bảng là 10,12,14,8

Để tìm độ lệch chuẩn 

Bước 1: Tìm giá trị trung bình của x đó là x̄

 10+14+12+8/4 = 11 

Bước 2: Tìm độ lệch của từng số: Trừ từng điểm với giá trị trung bình để có độ lệch trung bình

10 - 11 = -1 
12 - 11 = 1
14 - 11 = 3
8 - 11 = -3

Bước 3: Bình phương độ lệch trung bình thu được 

-1 1
1 1
3 9
-3 9

Bước 4: Tính tổng các bình phương 

1+1+9+9 = 20 

Bước 5: Tìm phương sai 

Chia tổng bình phương với n-1 được 4-1 = 3 

20 / 3 = 6.6 

Bước 6: Tìm căn bậc hai

Sqrt của 6.6 = 2.581

Do đó, Độ lệch chuẩn của x = 2.581

Tìm Y bằng phương pháp tương tự 

Độ lệch chuẩn của y = 10.29

Tương quan = 4 /(2.581 x10.29)

Tương quan = 0.15065

Vì vậy, bây giờ bạn có thể hiểu sự khác biệt giữa Hiệp phương sai và Tương quan.

[Nhúng nội dung]

Ứng dụng của hiệp phương sai

  1. Hiệp phương sai được sử dụng trong Sinh học – Di truyền học và Sinh học phân tử để đo một số DNA nhất định.
  2. Hiệp phương sai được sử dụng để dự đoán số tiền đầu tư vào các tài sản khác nhau trên thị trường tài chính 
  3. Hiệp phương sai được sử dụng rộng rãi để đối chiếu dữ liệu thu được từ các nghiên cứu thiên văn/đại dương học để đưa ra kết luận cuối cùng
  4. Trong Thống kê để phân tích một tập hợp dữ liệu có ý nghĩa logic của thành phần chính, chúng ta có thể sử dụng ma trận hiệp phương sai
  5. Nó cũng được sử dụng để nghiên cứu các tín hiệu thu được dưới nhiều hình thức khác nhau.

Ứng dụng của mối tương quan

  1. Thời gian và số tiền mà khách hàng bỏ ra trên các trang web thương mại điện tử trực tuyến 
  2. So sánh giữa các kỷ lục dự báo thời tiết trước đây với năm nay. 
  3. Được sử dụng rộng rãi trong nhận dạng mẫu
  4. Phân tích sự tăng nhiệt độ trong mùa hè so với mức tiêu thụ nước của các thành viên trong gia đình 
  5. Mối quan hệ giữa dân số và nghèo đói được đo lường 

Phương pháp tính tương quan

  1. Phương pháp đồ họa
  2. Phương pháp phân tán
  3. Bảng tương quan 
  4. Hệ số tương quan Karl Pearson 
  5. Hệ số sai lệch đồng thời
  6. Hệ số tương quan thứ hạng của Spearman

Trước khi đi vào chi tiết, trước tiên chúng ta hãy cố gắng hiểu phương sai và độ lệch chuẩn.

Kiểm tra nhanh - Khóa học phân tích thống kê

Phương sai

Phương sai là kỳ vọng về độ lệch bình phương của một biến ngẫu nhiên so với giá trị trung bình của nó. Một cách không chính thức, nó đo khoảng cách một tập hợp số cách xa giá trị trung bình của chúng.

Độ lệch chuẩn

Độ lệch chuẩn là thước đo mức độ biến thiên hoặc độ phân tán của một tập hợp các giá trị. Độ lệch chuẩn thấp cho biết các giá trị có xu hướng gần với giá trị trung bình của tập hợp, trong khi độ lệch chuẩn cao cho biết các giá trị được trải rộng trên một phạm vi rộng hơn. Về cơ bản nó đo lường độ biến thiên tuyệt đối của một biến ngẫu nhiên.

Hiệp phương sai và tương quan có liên quan với nhau, theo nghĩa hiệp phương sai xác định loại tương tác giữa hai biến, trong khi tương quan xác định hướng cũng như độ mạnh của mối quan hệ giữa hai biến.

Sự khác biệt giữa hiệp phương sai và tương quan

Cả số liệu Hiệp phương sai và Tương quan đều đánh giá hai biến trong toàn bộ miền chứ không phải trên một giá trị duy nhất. Sự khác biệt giữa chúng được tóm tắt dưới dạng bảng để tham khảo nhanh. Chúng ta hãy nhìn vào Hiệp phương sai và Tương quan.

Hiệp phương sai Tương quan
Hiệp phương sai là thước đo để chỉ ra mức độ mà hai biến ngẫu nhiên thay đổi song song. Tương quan là thước đo được sử dụng để thể hiện mức độ liên quan giữa hai biến ngẫu nhiên với nhau.
Hiệp phương sai không là gì ngoài thước đo mối tương quan. Tương quan đề cập đến dạng hiệp phương sai được chia tỷ lệ.
Hiệp phương sai chỉ ra hướng của mối quan hệ tuyến tính giữa các biến. Mặt khác, mối tương quan đo lường cả cường độ và hướng của mối quan hệ tuyến tính giữa hai biến.
Phương sai có thể thay đổi giữa -∞ và + ∞ Phạm vi tương quan giữa -1 và +1
Hiệp phương sai bị ảnh hưởng bởi sự thay đổi về quy mô. Nếu tất cả các giá trị của một biến được nhân với một hằng số và tất cả các giá trị của một biến khác được nhân với một hằng số tương tự hoặc khác nhau, thì hiệp phương sai sẽ thay đổi.  Tương quan không bị ảnh hưởng bởi sự thay đổi về quy mô.
Hiệp phương sai giả định các đơn vị từ tích của các đơn vị của hai biến. Mối tương quan là không thứ nguyên, tức là Đó là thước đo không có đơn vị về mối quan hệ giữa các biến.
Hiệp phương sai của hai biến phụ thuộc đo lường mức độ trung bình của chúng đồng biến đổi theo số lượng thực (tức là cm, kg, lít). Mối tương quan của hai biến phụ thuộc đo lường tỷ lệ mức độ trung bình của các biến này thay đổi lẫn nhau.
Hiệp phương sai bằng XNUMX trong trường hợp các biến độc lập (nếu một biến di chuyển còn biến kia thì không) vì khi đó các biến không nhất thiết phải di chuyển cùng nhau. Các chuyển động độc lập không đóng góp vào mối tương quan tổng thể. Do đó, các biến hoàn toàn độc lập có mối tương quan bằng không.

Kết luận

Hiệp phương sai được ký hiệu là Cov(X, Y), đóng vai trò là bước đầu tiên trong việc định lượng hướng của mối quan hệ giữa các biến X và Y. Về mặt kỹ thuật, đó là giá trị kỳ vọng của tích độ lệch của từng biến so với phương tiện tương ứng của chúng. Dấu của hiệp phương sai thể hiện rõ ràng hướng của mối quan hệ tuyến tính—hiệp phương sai dương cho biết X và Y di chuyển theo cùng một hướng, trong khi hiệp phương sai âm cho thấy mối quan hệ nghịch đảo. Tuy nhiên, một trong những hạn chế của hiệp phương sai là độ lớn của nó không bị giới hạn và có thể bị ảnh hưởng bởi quy mô của các biến, khiến nó khó diễn giải được khi đứng riêng lẻ.

Tương quan, đặc biệt là hệ số tương quan Pearson (r), cải tiến khái niệm hiệp phương sai bằng cách chuẩn hóa nó. Hệ số tương quan là một đại lượng không thứ nguyên thu được bằng cách chia hiệp phương sai của hai biến cho tích của độ lệch chuẩn của chúng. Việc chuẩn hóa này giới hạn hệ số tương quan trong phạm vi bao gồm từ -1 đến 1. Giá trị 1 ngụ ý mối quan hệ tuyến tính dương hoàn hảo, -1 ngụ ý mối quan hệ tuyến tính âm hoàn hảo và 0 biểu thị không có mối quan hệ tuyến tính. Giá trị tuyệt đối của hệ số tương quan cung cấp thước đo độ bền của mối quan hệ.

Về mặt toán học, hệ số tương quan Pearson được biểu thị như sau:

Điều cần thiết là phải nhận ra rằng cả hiệp phương sai và tương quan chỉ xem xét các mối quan hệ tuyến tính và có thể không biểu thị các mối liên hệ phức tạp hơn. Ngoài ra, sự hiện diện của mối tương quan không hàm ý quan hệ nhân quả. Mối tương quan chỉ cho thấy rằng có một mối quan hệ chứ không phải sự thay đổi ở một biến sẽ gây ra những thay đổi ở biến kia.

Tóm lại, hiệp phương sai và tương quan là các công cụ nền tảng để phân tích thống kê cung cấp cái nhìn sâu sắc về mối liên hệ giữa hai biến số, nhưng chính mối tương quan mới mang lại cho chúng ta thước đo có thể mở rộng và có thể giải thích được về độ mạnh của mối quan hệ này.

Cả Tương quan và Hiệp phương sai đều có liên quan rất chặt chẽ với nhau nhưng chúng khác nhau rất nhiều. 

Khi nói đến việc lựa chọn giữa Hiệp phương sai và Tương quan, tương quan là lựa chọn đầu tiên vì nó không bị ảnh hưởng bởi sự thay đổi về thứ nguyên, vị trí và tỷ lệ và cũng có thể được sử dụng để so sánh giữa hai cặp biến. Vì nó bị giới hạn trong phạm vi từ -1 đến +1 nên việc so sánh giữa các biến giữa các miền sẽ rất hữu ích. Tuy nhiên, một hạn chế quan trọng là cả hai khái niệm này đều đo lường mối quan hệ tuyến tính duy nhất.

Câu hỏi thường gặp về Covarinca và Corelation

Hiệp phương sai dương cho biết điều gì về hai biến?

Hiệp phương sai dương chỉ ra rằng khi một biến tăng thì biến kia cũng có xu hướng tăng. Ngược lại, khi một biến giảm thì biến kia có xu hướng giảm. Điều này ngụ ý mối quan hệ trực tiếp giữa hai biến.

Mối tương quan có thể được sử dụng để suy ra quan hệ nhân quả giữa hai biến không?

Không, không thể chỉ sử dụng mối tương quan để suy ra quan hệ nhân quả. Mặc dù mối tương quan đo lường cường độ và chiều hướng của mối quan hệ giữa hai biến, nhưng nó không hàm ý rằng những thay đổi ở một biến sẽ gây ra những thay đổi ở biến kia. Việc thiết lập mối quan hệ nhân quả đòi hỏi phải kiểm tra và phân tích thống kê sâu hơn, thường thông qua các thí nghiệm được kiểm soát hoặc nghiên cứu theo chiều dọc.

Tại sao mối tương quan được ưu tiên hơn hiệp phương sai khi so sánh mối quan hệ giữa các cặp biến khác nhau?

Mối tương quan được ưu tiên hơn vì đây là thước đo không thứ nguyên cung cấp thang đo chuẩn hóa từ -1 đến 1, mô tả cả cường độ và hướng của mối quan hệ tuyến tính giữa các biến. Việc tiêu chuẩn hóa này cho phép so sánh giữa các cặp biến khác nhau, bất kể đơn vị đo lường của chúng là gì, điều này không thể thực hiện được với hiệp phương sai.

Hệ số tương quan bằng 0 có ý nghĩa gì?

Hệ số tương quan bằng 0 ngụ ý rằng không có mối quan hệ tuyến tính giữa hai biến. Tuy nhiên, điều quan trọng cần lưu ý là vẫn có thể có mối quan hệ phi tuyến tính giữa chúng mà hệ số tương quan không thể phát hiện được.

Các ngoại lệ có khả năng ảnh hưởng đến hiệp phương sai và tương quan như thế nào?

Các ngoại lệ có thể ảnh hưởng đáng kể đến cả hiệp phương sai và tương quan. Vì các thước đo này dựa trên giá trị trung bình của các biến, nên một ngoại lệ có thể làm lệch giá trị trung bình và làm sai lệch bức tranh tổng thể của mối quan hệ. Một ngoại lệ có thể có ảnh hưởng lớn đến kết quả, dẫn đến đánh giá quá cao hoặc đánh giá thấp mối quan hệ thực sự.

ICó thể có hiệp phương sai cao nhưng tương quan thấp?

Đúng, có thể có hiệp phương sai cao nhưng mối tương quan thấp nếu các biến có phương sai cao. Bởi vì mối tương quan chuẩn hóa hiệp phương sai bằng độ lệch chuẩn của các biến, nếu độ lệch chuẩn đó lớn, mối tương quan vẫn có thể thấp ngay cả khi hiệp phương sai cao.

Điều đó có nghĩa là gì nếu hai biến có mối tương quan cao?

Mối tương quan cao có nghĩa là có mối quan hệ tuyến tính chặt chẽ giữa hai biến. Nếu mối tương quan dương thì các biến có xu hướng di chuyển cùng nhau; nếu nó âm, chúng có xu hướng di chuyển theo hướng ngược nhau. Tuy nhiên, “cao” là một thuật ngữ tương đối và ngưỡng cho những yếu tố tạo nên mối tương quan cao có thể khác nhau tùy theo lĩnh vực và bối cảnh.

Nếu bạn muốn tìm hiểu thêm về các khái niệm thống kê như hiệp phương sai và tương quan, hãy nâng cao kỹ năng với Great Learning's Chương trình PG về Khoa học dữ liệu và Phân tích kinh doanh. Khóa học PGP DSBA được thiết kế đặc biệt cho các chuyên gia đang làm việc và giúp bạn thăng tiến trong sự nghiệp. Bạn có thể học hỏi với sự trợ giúp của các buổi cố vấn và các dự án thực hành dưới sự hướng dẫn của các chuyên gia trong ngành. Bạn cũng sẽ có quyền truy cập vào hỗ trợ nghề nghiệp và hơn 350 công ty. Bạn cũng có thể tham khảo Great Learning Academy khóa học chứng chỉ trực tuyến miễn phí.

Đọc thêm

  1. Giảm kích thước là gì - Tổng quan
  2. Thống kê suy luận - Tổng quan | Giới thiệu về thống kê suy luận
  3. Hiểu phân phối trong thống kê
  4. Kiểm tra giả thuyết trong R – Ví dụ giới thiệu và nghiên cứu điển hình
tại chỗ_img

Tin tức mới nhất

tại chỗ_img