Cách nhận biết tương quan ở mức trung bình

Correlation Coefficient là gì? Hệ số tương quan r là thước đo thống kê được nhiều người bởi tính chính xác và tính hiệu quả trong việc đưa ra kết quả nhanh chóng. Vậy hệ số pearson là gì? Công

thức tính như thế nào? Có những tác động nào ảnh hưởng tới nó hay không? Tất cả thông tin mà bạn

đang thắc mắc sẽ có trong bài viết mà Luận Văn 1080 sẽ giới thiệu bên dưới!

1. Khái quát về hệ số tương quan r

Hệ số tương quan r

1. Định nghĩa

Correlation Coefficient là gì? Correlation Coefficient được gọi là hệ số tương quan r, là một đại

lượng thống kê được sử dụng để đo độ liên quan tuyến tính giữa hai biến số và có giá trị nằm trong

khoảng từ -1 đến 1.

1. Ý nghĩa hệ số tương quan r

 Mỗi giá trị và mỗi biến tính hệ số tương quan r đều mang một ý nghĩa khác nhau và thể hiện chức năng của nó. Trong đó:

Giá trị của r Ý nghĩa hệ số tương quan r

r = 0  Hai biến đã chọn không có quan hệ tương quan tuyến tính tuyệt đối.

r = 1 hoặc r =

  • 1
 Hai biến có quan hệ liên quan tuyến tính tuyệt đối.

r < 0

 Hệ số tương quan âm, đồng nghĩa với việc giá trị hai biến sẽ đối lập nhau.
 Khi giá trị biến x giảm thì giá trị của biến y tăng và ngược lại.

r > 0

 Hệ số tương quan dương. Điều này mang ý nghĩa giá trị 2 biến phụ thuộc

nhau song hành nhau.

 Nếu giá trị biến x tăng thì y cũng tăng và ngược khi giá trị biến y tăng thì

biến x cũng tăng.

1. Trường hợp sử dụng hệ số tương quan person

 Hệ số tương quan pearson SPSS thường được sử dụng trong các nghiên cứu khoa học, kinh tế, y học và một số lĩnh vực khác. Nó sẽ giúp bạn trả lời cho các câu hỏi như: o Có mối quan hệ tương quan giữa doanh thu bán kem và nhiệt độ không? o Có mối quan hệ tương quan giữa năng suất, thu nhập và sự hài lòng công việc của nhân viên? o Hai biến nào có mối liên hệ chặt chẽ nhất giữa chiều cao, tuổi và cân nặng?  Khi sử dụng hệ số tương quan Pearson SPSS, cần lưu ý rằng nó chỉ đo mối tương quan tuyến tính giữa hai biến và không phải là chứng cứ về mối quan hệ nhân quả giữa chúng.

2. Tính chất của hệ số tương quan r

Dưới đây là 6 tính chất của hệ số tương quan pearson:  Hệ số tương quan pearson không bị ảnh hưởng bởi việc đổi vị trí của hai biến số.

 Giá trị của hệ số tương quan r có thể bị ảnh hưởng nếu tồn tại các giá trị ngoại lai (outliers) và phân phối của dữ liệu  Giá trị của r không phản ánh chính xác mối tương quan giữa hai biến số nếu một trong hai biến số có phân phối không chuẩn (tức, không tuân theo phân phối chuẩn).  Hệ số tương quan r không chỉ ra mối quan hệ nhân quả giữa hai biến số và cũng sử dụng để suy ra mối quan hệ nhân quả.  Hệ số tương quan r có tính đối xứng, tức là giá trị của r giữa biến số X và Y bằng giá trị của r giữa biến số Y và X.  Giá trị của r không phụ thuộc vào đơn vị đo của hai biến số.

3. Công thức tính và tác động của các yếu tố đến hệ số tương

quan r

3. Công thức

Cách tính hệ số tương quan pearson như sau:

Trong đó:  N: Số cặp điểm  Σxy: tổng các tích của các điểm được ghép nối  Σx: tổng điểm x  Σy: tổng điểm y  Σx2: tổng điểm của x bình phương  Σy2: tổng điểm của y bình phương

3. Tác động

Có 3 yếu tố có tác động đến hệ số tương quan r:  Outlier: Các giá trị ngoại lệ có thể làm giảm tính chính xác của hệ số tương quan pearson.  Phân phối không chuẩn: Nếu dữ liệu không tuân theo phân phối chuẩn, hệ số tương quan r có thể bị sai lệch.  Kích thước mẫu: Kích thước mẫu càng lớn thì hệ số r càng chính xác. Tuy nhiên, với kích thước mẫu nhỏ, hệ số tương quan pearson có thể bị sai lệch và không phản ánh chính xác mối quan hệ giữa hai biến số. Khi phân tích dữ liệu trong kinh tế lượng, hiệp phương sai là một công cụ đác lục không thể thiếu. Nó

cho phép chúng ta biết được mức độ tương quan giữa hai biến và hướng của mối quan hệ đó là thuận

hay nghịch. Nhờ đó, chúng ta có thể phân tích và dự đoán được các biến phụ thuộc và đưa ra các

quyết định phù hợp. Vậy Hiệp phương sai là gì? Cách tính Hiệp phương sai như thế nào, cùng Luận văn 1080 tìm hiểu nhé!

 Bước 4. Bạn sẽ thấy một hộp thoại mới xuất hiện trên màn hình làm việc. Tại đây, bạn sẽ tiến hành thực hiện chọn biến để chạy tương quan.  Cột bên trái là các biến có trong dữ liệu, bạn cần click chọn các biến cần tiến hành chạy tương quan SPSS. Các biến được chọn sẽ xuất hiện tại ô Variables.

 Bước 5. Điều chỉnh các tùy chọn tương quan nếu cần thiết. Trong đó, bao gồm phương pháp tính tương quan, hiển thị giá trị tương quan, các thông số thống kê khác và tùy chọn khác.

Correlation Coefficients: Hệ số tương quan

Pearson

Hệ số được chọn mặc định. Bảng kết quả sẽ thể hiện một ma trận vuông chứa các hệ số tương quan.

Kendall’s

tau-b

Hệ số tương quan hạng, được ước tính bằng cách tìm các cặp số (x, y) “song hành" với nhau.

Spearman

Spearman là thước đo phi tham số về tương quan hạng (sự phụ thuộc thống kê giữa thứ hạng của hai biến).

Test of significance: Kiểm định mức ý nghĩa

Two-tail

 Kiểm định hai phía.
 Được dùng trong trường hợp chiều hướng của mối liên hệ tuyến tính không

thể xác định trước được.

 Đây là loại kiểm định được chọn mặc định.

One-tail:

 Kiểm định một phía.
 Được dùng khi bạn có thể xác định trước chiều hướng của mối liên hệ giữa

hai biến trong phần phân tích.

Flag significant correlations - Gắn cờ các mối tương quan có ý nghĩa thống kê.

 Khi bạn đánh dấu tùy chọn này, trong kết quả đầu ra sẽ có các dấu hoa thị (**) bên

cạnh các mối tương quan có ý nghĩa thống kê.

 SPSS sẽ đánh dấu ý nghĩa thống kê ở mức alpha = 0 và alpha = 0.

Options: Các tùy chọn

Statistics

 Cho chúng ta biết thông tin chung về biến đưa vào chạy thống kê, bao gồm:
o Means and standard deviations: Cho biết giá trị trung bình và độ

lệch chuẩn.

o Cross-product deviations and covariances: Cho biết độ lệch chuẩn

sản phẩm chéo và phương sai.

Missing

Values

 Cho biết cách xử lý khi dữ liệu bị lỗi, gồm các lựa chọn sau:
o Exclude cases pairwise: Chỉ loại bỏ những giá trị trống của dòng dữ

liệu bị lỗi, các cột có dữ liệu vẫn sẽ được thực hiện phân tích.

o Exclude cases listwise: Loại bỏ hoàn toàn dòng dữ liệu bị lỗi ra khỏi

các phân tích liên quan. 

Bước 6. Sau khi đã chọn biến và thực hiện các nội dung liên quan, bạn nhấn nút OK để bắt đầu chạy tương quan SPSS.  Bước 7: Xem kết quả phân tích tương quan. Sau khi chạy tương quan trong SPSS, bạn sẽ nhận được bảng hiển thị kết quả tính toán, bao gồm hệ số tương quan Pearson, giá trị p, số lượng quan sát, giá trị trung bình, độ lệch chuẩn và các thông số khác.

 Cột Sig. (2-tailed): Giá trị p cho thấy mức độ đáng tin cậy của kết quả hệ số tương quan r. Giá trị p < 0,05 cho thấy kết quả là đáng tin cậy.  Cột Lower Bound và Upper Bound: Đây là khoảng tin cậy của hệ số tương quan r. Nếu khoảng tin cậy này không bao gồm giá trị 0, bạn có thể kết luận rằng mối quan hệ giữa hai biến số là có ý nghĩa thống kê.

Ví dụ:

n N Pearson Correlation Sig. (2-tailed) Lower Bound Upper Bound

X 100 0 0 0 0.

Y 100  Cột Biến (n): Bạn đang xem kết quả của biến X và Y.  Cột N: Có 100 giá trị không bị thiếu cho biến X và Y.  Cột Pearson Correlation: Hệ số tương quan r giữa X và Y là 0. Giá trị này thể hiện mức độ tương quan tuyến tính giữa hai biến, với giá trị dương thể hiện mối quan hệ thuận (cùng tăng hoặc giảm), và ngược lại giá trị âm thể hiện mối quan hệ nghịch

4. Các giá trị có thể có của hệ số tương quan r

Hệ số tương quan r có thể có các giá trị sau:  Giá trị r = 1: Mối quan hệ tuyến tính hoàn hảo giữa hai biến số.  Giá trị r > 0 hoặc r < -0: Mối quan hệ tuyến tính mạnh giữa hai biến số.  Giá trị r > 0 hoặc r < -0: Mối quan hệ tuyến tính trung bình giữa hai biến số.  Giá trị r < 0 hoặc r > -0: Mối quan hệ tuyến tính yếu giữa hai biến số.

5. Ứng dụng cơ bản của hệ số tương quan r trong SPSS

Ứng dụng của hệ số tương quan (r) trong SPSS  Phân tích mối quan hệ giữa hai biến số o Hệ số tương quan r trong SPSS cho phép bạn phân tích mối quan hệ giữa hai biến số. Khi giá trị r gần 0, điều này cho thấy rằng hai biến số không có mối quan hệ tuyến tính. Khi giá trị r gần -1 hoặc 1, điều này cho thấy rằng hai biến số có mối quan hệ tuyến tính mạnh.  Kiểm tra giả thuyết về mối quan hệ giữa hai biến số: o Hệ số tương quan r cũng có thể được sử dụng để kiểm tra giả thuyết về mối quan hệ giữa hai biến số. o Nếu giá trị p-value nhỏ hơn mức ý nghĩa (chẳng hạn như 0), thì giả thuyết rằng không có mối quan hệ tuyến tính giữa hai biến số sẽ bị bác bỏ.Tương quan là một trong những bước cần thiết trước khi thực hiện hồi quy. o Nếu bạn thực hiện chạy tương quan r trong SPSS, kết quả từ tương quan r cho bạn biết được biến độc lập có tương quan với biến phụ thuộc và khả năng biến độc lập đó sẽ tác động lên biến phụ thuộc ở hồi quy SPSS sẽ cao hơn. o Bạn có thể tìm hiểu kỹ hơn về mô hình hồi quy, hệ số chặn trong mô hình hồi quy và ý nghĩa của chúng trong các bài viết tại Luận văn 1080.  Ví dụ về việc sử dụng hệ số tương quan r trong các nghiên cứu: o Hệ số tương quan r có thể được sử dụng trong các nghiên cứu y học để phân tích mối quan hệ giữa các biến số liên quan đến sức khỏe của người bệnh.

 Ví dụ, hệ số tương quan r có thể được sử dụng để phân tích mối quan hệ giữa BMI (Chỉ số khối cơ thể) và lượng mỡ trong máu của người bệnh. o Hệ số tương quan r cũng có thể được sử dụng trong các nghiên cứu về kinh tế hoặc tài chính để phân tích mối quan hệ giữa các biến số kinh tế hoặc tài chính.  Ví dụ, hệ số tương quan r có thể được sử dụng để phân tích mối quan hệ giữa thu nhập và độ tuổi của những người tham gia nghiên cứu.

6. Lưu ý cần biết khi sử dụng hệ số tương quan r

Khi sử dụng hệ số tương quan r, bạn cần lưu ý đến 5 điều sau:  Giới hạn của hệ số tương quan r: một số tương quan yếu có thể được bỏ qua nếu không có đủ dữ liệu hoặc không có sự hiểu biết đầy đủ về mối tương quan đó.  Hệ số tương quan pearson chỉ đo lường mối tương quan tuyến tính giữa hai biến số, nó không cho phép xác định nguyên nhân và kết quả giữa các biến số. Chính vì vậy, bạn cần cẩn trọng khi suy ra những mối quan hệ giả hoặc kết luận vô căn cứ từ hệ số tương quan r.  Hệ số tương quan r chỉ áp dụng cho mô hình tuyến tính, tức là giả định rằng mối quan hệ giữa hai biến số là tuyến tính. Hệ số tương quan pearson không phản ánh chính xác mối quan hệ giữa chúng nếu giữa hai biến số không phải là tuyến tính.  Nếu các quan sát khác nhau không độc lập thì hệ số r có thể bị sai lệch. Ví dụ như khi một người được quan sát nhiều lần hoặc khi các quan sát có sự tương quan với nhau.  Các yếu tố có thể làm giảm tính chính xác của hệ số tương quan r: dữ liệu bị thiếu hoặc không chính xác, outlier, phân phối không chuẩn, kích thước mẫu, sự tương quan phi tuyến tính, các biến số không đầy đủ và mô hình tuyến tính không phù hợp.  Bạn cần phải cẩn trọng và đánh giá kỹ lưỡng để đảm bảo tính chính xác, độ tin cậy của kết quả phân tích. Hệ số tương quan r là một thước đo rất quan trọng nhằm giúp chúng ta hiểu rõ hơn về mối tương

quan giữa các biến số, giúp bạn đưa ra các quyết định đúng đắn hơn. Vì vậy, việc phân tích hệ số r là

điều cần thiết. Nếu bạn đang gặp khó khăn trong việc phân tích dữ liệu trên phần mềm Eviews, tham

khảo dịch vụ hỗ trợ SPSS tại Luận Văn 1080 - giúp bạn xử lý số liệu nhanh chóng, kết quả chính xác, đồng thời giúp cho bài nghiên cứu của bạn trở nên chất lượng và đạt điểm cao.

Hệ số tương quan r là một chỉ số để đo mức độ mạnh yếu giữa hai biến số và được sử dụng trong

nhiều lĩnh vực (khoa học, y tế, kinh tế...). Nó cung cấp thông tin về mức độ quan trọng của mối

tương quan, mối quan hệ hoặc mối liên hệ. Việc kiểm tra hệ số tương quan person có thể giúp phát hiện vấn đề đa cộng tuyến khi các biến độc lập có sự tương quan mạnh với nhau. Do đó, nghiên cứu