Nonparametric test là gì

Thống kê so với phi tham số

Thống kê là một ngành nghiên cứu cho phép chúng ta hiểu động lực dân số một dân số quan tâm nhất định. Điều cần thiết là các mẫu này sẽ ngẫu nhiên. Nhiều công thức được tạo ra với sự kết hợp của toán học, để đưa ra suy luận về các tham số dân số. Đương nhiên bất kỳ dân số nào có thể có "Phân bố chuẩn", nơi sự phân tán dữ liệu / mẫu có hình dạng của một chuông trên đồ thị tần số. Trong phân bố bình thường, hầu hết các mẫu đều tập trung khoảng trung bình và 68%, 95%, 99% dữ liệu được tìm thấy trong khoảng 1, 2 và 3 độ lệch chuẩn tương ứng. Thống kê tham số và phiparametric phụ thuộc vào việc phân phối bình thường được xem xét hay không.

Thống kê Tham số là gì?

Thống kê Tham số là số liệu thống kê trong đó dữ liệu / mẫu được coi là được rút ra từ phân phối bình thường. Định nghĩa thống kê tham số là "số liệu thống kê giả định rằng dữ liệu đến từ một loại xác suất phân phối và đưa ra các suy luận về các tham số của phân phối". Hầu hết các phương pháp thống kê cơ bản được biết đến thuộc về nhóm này. Trong thực tế, chúng có thể không được phân phối bình thường. Do đó, loại thống kê này dựa trên nhiều giả định. Nếu dữ liệu / mẫu thường phân bố hoặc phân phối gần như bình thường, các công thức có thể cho kết quả chính xác và suy luận. Tuy nhiên, nếu giả định là phân phối bình thường là sai, thống kê tham số có thể là khá sai lầm.

Thống kê phi tham số là gì?

Thống kê phi tham số còn được gọi là số liệu thống kê phân bố. Lợi thế của loại thống kê này là nó không phải làm cho một giả định như trước đây được thực hiện với parametrics. Tính toán thống kê phi tham số có ý nghĩa trung bình so với phương tiện. Vì vậy, nếu một hoặc hai lệch từ giá trị trung bình, hiệu quả của chúng là bị bỏ quên. Nói chung các tham số tham số được ưa thích hơn vì nó có nhiều quyền lực hơn để bác bỏ một giả thuyết giả mạo hơn là phương pháp phiparametric. Một trong những bài kiểm tra phi tham số nổi tiếng nhất là bài kiểm tra Chi-square. Có một số phép so sánh khôngparametric cho một số phép thử tham số như Wilcoxon T Test cho t-test mẫu ghép đôi, Mann-Whitney U Test cho t-test mẫu độc lập, tương quan của Spearman đối với tương quan của Pearson vv .. Đối với một mẫu thử nghiệm t, không có so sánh không kiểm tra tham số.

Sự khác biệt giữa Tham số và Không Tham số là gì?

• Thống kê tham số phụ thuộc vào phân phối bình thường, nhưng thống kê phi tham số không phụ thuộc vào phân phối bình thường.

• Các thống kê tham số đưa ra nhiều giả định hơn các thống kê phi-Tham số.

• Thống kê tham số sử dụng các công thức đơn giản hơn so với thống kê phi tham số.

• Khi dân số được phân bố bình thường hoặc gần phân phối bình thường, thống kê tham số là cách tốt nhất để sử dụng. Nếu không, cách tốt nhất là sử dụng một phương pháp phiparametric.

• Hầu hết các phương pháp thống kê cơ bản được biết đến đều thuộc về thống kê tham số. Thống kê phi tham số ít được sử dụng và áp dụng cho các trường hợp đặc biệt.

Thống kê phi tham số [nonparametric statistics] là ngành thống kê trong đó các tham số của phân phối tổng thể không được xác định trước. Nghĩa là, người ta không đưa ra những giả định về hình dạng của phân phối tổng thể trước khi vận dụng một phương pháp. Các kiểm định thống kê phi tham số có thể được thực hiện dựa vào các dữ liệu không phải thực sự bằng số. Chẳng hạn, dựa vào số thứ tự người ta có thể kiểm định về hạng của các biến số. Những kiểm định như vậy đôi khi được gọi là kiểm định hạng.

1. KIỂM ĐỊNH THAM SỐ

Kiểm định tham số [Parametric tests] là công cụ mạnh vì xử lý các dữ liệu dạng scale [interval, ratio]. Thực hiện kiểm định này đòi hỏi một số giả định:

  1. Các quan sát phải độc lập với nhau,
  2. Các quan sát phải được rút ra từ các tổng thể có phân phối chuẩn,
  3. Các tổng thể nên có phương sai đồng nhất,
  4. Thang đo phải ở dạng scale để các tính toán có thể thực hiện được.

Ưu điểm của kiểm định tham số là đơn giản, dễ thực hiện, độ tin cậy cao. Tuy nhiên, nó đòi hỏi khắt khe về sự “chuẩn hóa” của dữ liệu. Do vậy, chi phí thu thập [thực hiện] cao và đôi khi khó thực hiện trong thực tế.

Ví dụ: Chúng ta muốn so sánh lương khởi điểm của sinh viên tốt nghiệp ở ngành kinh tế và điện tử. Thu nhập dữ liệu từ 200 doanh nghiệp trên địa bàn TpHCM, chúng ta kiểm định giả thuyết là lương khởi điểm của sinh viên tốt nghiệp ở 2 ngành này là như nhau.

Mỗi kiểm định tham số đều có tương ứng một kiểm định phi tham số thay thế. Chẳng hạn,  kiểm định Kruskal–Wallis thay thế phân tích phương sai một chiều, kiểm định dấu và hạng Wiloxon sử dụng thay thế kiểm định t-test cặp đôi hoặc hạng tương quan Spearman thay thế hồi quy tuyến tính… Một số kiểm định thay thế này được liệt kê ở bảng bên dưới.

2. KIỂM ĐỊNH PHI THAM SỐ

Trong nhiều tình huống thực tế, số liệu chỉ có thể biểu hiện dưới hình thức dấu hoặc xếp hạng, vì vậy không thể sử dụng các kiểm định tham số để thực hiện. Trong trường hợp này kiểm định Wilconxon và Mann-Whitney là hai lọai kiểm định phi tham số thông dụng nhất ứng với hai trường hợp: một là sử dụng cho mẫu ngẫu nhiên gồm các quan sát từng cặp và một dùng cho mẫu ngẫu nhiên độc lập.

Kiểm định phi tham số [Nonparametric Tests] được sử dụng trong những trường hợp dữ liệu không có phân phối chuẩn, hoặc cho các mẫu nhỏ có ít quan sát. Kiểm định phi tham số cũng được dùng cho các dữ liệu định danh [nominal], dữ liệu thứ bậc [ordinal] hoặc dữ liệu khoảng cách [interval] có phân phối bất kì.

Nhược điểm của kiểm định phi tham số là khả năng tìm ra được sự sai biệt kém, không mạnh như các phép kiểm có tham số [T student, phân tích phương sai…], đồng thời khó mở rộng để giải quyết các mô hình kinh tế phức tạp.

Sau đây là các kiểm định phi tham số được dùng tương đương với các kiểm định có tham số.

Bảng 1: Tổng hợp các kiểm định phi tham số và kiểm định tham số

Bài liên quan

Thống kê phi tham số [nonparametric statistics] là ngành thống kê trong đó các tham số của phân phối tổng thể không được xác định trước. Nghĩa là, người ta không đưa ra những giả định về hình dạng của phân phối tổng thể trước khi vận dụng một phương pháp. Các kiểm định thống kê phi tham số có thể được thực hiện dựa vào các dữ liệu không phải thực sự bằng số. Chẳng hạn, dựa vào các số thứ tự người ta có thể kiểm định về hạng của các biến số. Những kiểm định như vậy đôi khi được gọi là kiểm định hạng.

[Tài liệu tham khảo: Nguyễn Văn Ngọc, Từ điển Kinh tế học, Đại học Kinh tế Quốc dân]

Thống kê phi tham số có ưu điểm:

- Không dùng các tham số của tổng thể, không cần giả thiết phân phối chuẩn,nói chung không đòi hỏi nhiều điều kiện đối với dữ liệu.

- Dùng được cho nhiều loại biến chứ không riêng gì biến định lượng

- Việc tính các thống kê phi tham số thường đơn giản dễ tính.  

Thống kê phi tham số có nhược điểm:

- Chuyển sang thứ hạng nên mất nhiều thông tin về bản chất dữ liệu do đó nếu gặp biến định lượng và phân phối chuẩn thì thống kê phi tham số không mạnh bằng thống kê tham số, điều này tương tự như khi tổ chức chạy thi 100m, nếu có dụng cụ đo chính xác thì biết rõ thành tích người thứ nhất chạy hết 9,70 giây, người thứ hai 9,80 giây,. . . Còn nếu không có dụng cụ đo thì chỉ ghi lại về đầu, về thứ hai ,. . . .

- Không có nhiều kết luận đi sâu về mặt định lượng hoặc nếu có thì việc tính toán tương đối khó

Video liên quan

Chủ Đề