Kiểm định phân phối chuẩn là bước quan trọng trong việc kiểm tra tính hợp lệ của dữ liệu trước khi tiến hành các phân tích thống kê. Một trong những công cụ hữu ích trong việc kiểm tra phân phối chuẩn là Kiểm định Shapiro-Wilk. Bài viết này sẽ giải thích về cách thực hiện kiểm định Shapiro-Wilk trong SPSS, cách phân tích kết quả và những lưu ý khi sử dụng phương pháp này.
Kiểm Định Shapiro-Wilk Là Gì?
Kiểm định Shapiro-Wilk là một phương pháp phổ biến để đánh giá xem dữ liệu có tuân theo phân phối chuẩn hay không. Phương pháp này so sánh phân phối của dữ liệu thực nghiệm với một phân phối chuẩn lý thuyết (phân phối chuẩn với cùng trung bình và độ lệch chuẩn). Nếu kết quả kiểm định có giá trị p (sig) > 0.05, điều này có nghĩa là dữ liệu không khác biệt đáng kể với phân phối chuẩn và có thể xem là phân phối chuẩn. Ngược lại, nếu p < 0.05, chúng ta sẽ kết luận dữ liệu không phân phối chuẩn.
Cơ Chế Hoạt Động Của Kiểm Định Shapiro-Wilk
Khi thực hiện kiểm định Shapiro-Wilk, phần mềm SPSS sẽ tính toán một giá trị thống kê (Statistic) và giá trị sig (mức ý nghĩa) để kiểm tra sự khác biệt giữa phân phối thực tế và phân phối chuẩn lý thuyết. Nếu giá trị sig lớn hơn 0.05, chúng ta không có đủ bằng chứng để bác bỏ giả thuyết rằng dữ liệu có phân phối chuẩn. Nếu giá trị sig nhỏ hơn 0.05, có thể kết luận dữ liệu không tuân theo phân phối chuẩn.
Tuy nhiên, cần lưu ý rằng trong các mẫu lớn, ngay cả khi dữ liệu chỉ lệch nhẹ khỏi phân phối chuẩn, Kiểm định Shapiro-Wilk vẫn có thể cho kết quả sig < 0.05. Điều này có thể dẫn đến kết luận sai lệch, cho thấy dữ liệu không chuẩn dù độ lệch rất nhỏ.
Cỡ Mẫu Phù Hợp Khi Sử Dụng Kiểm Định Shapiro-Wilk
Theo nghiên cứu của Prabhakar Mishra và cộng sự (2019), Kiểm định Shapiro-Wilk là lựa chọn lý tưởng khi cỡ mẫu của bạn nhỏ, tốt nhất là dưới 50. Tuy nhiên, kiểm định này vẫn có thể sử dụng cho các cỡ mẫu lớn hơn, với tối đa khoảng 2000 mẫu tùy thuộc vào phần mềm.
- Cỡ mẫu ≤ 50: Kiểm định Shapiro-Wilk là lựa chọn tốt nhất vì độ nhạy cao.
- Cỡ mẫu > 50: Có thể sử dụng cả Shapiro-Wilk và Kolmogorov-Smirnov, tuy nhiên, Shapiro-Wilk vẫn được ưu tiên nhờ độ nhạy cao hơn.
Cách Thực Hiện Kiểm Định Shapiro-Wilk Trong SPSS
Dưới đây là hướng dẫn chi tiết về cách thực hiện Kiểm định Shapiro-Wilk trong SPSS với một bộ dữ liệu thực tế.
Bước 1: Chuẩn Bị Dữ Liệu
Giả sử bạn có bộ dữ liệu với cỡ mẫu N = 200, bao gồm ba biến cần kiểm định phân phối chuẩn:
- Biến HaiLong: Dữ liệu từ các biến quan sát nhỏ đo lường bằng thước đo Likert 1-5.
- Biến DoTuoi: Dữ liệu độ tuổi của các đối tượng khảo sát từ 19-40 tuổi.
- Biến ThuNhap: Dữ liệu thu nhập hằng tháng của các đối tượng khảo sát.

Bước 2: Chạy Kiểm Định Shapiro-Wilk Trong SPSS
- Vào menu Analyze > Descriptive Statistics > Explore….
- Kéo các biến cần kiểm định vào ô Dependent List.
- Nếu cần kiểm tra phân phối chuẩn theo nhóm, đưa biến phân nhóm vào ô Factor List.
- Nhấp vào nút Plots…, chọn Normality plots with tests và Histogram, rồi nhấp Continue.
- Nhấn OK để xuất kết quả.



Bước 3: Đọc Kết Quả Kiểm Định
Trong bảng Tests of Normality, bạn sẽ thấy các thông số sau:
- Statistic: Giá trị thống kê của kiểm định.
- Sig.: Giá trị p (mức ý nghĩa).
Ví dụ kết quả:
- Biến “HaiLong”: Kiểm định Shapiro-Wilk cho Sig. = 0.000 < 0.05, nên kết luận dữ liệu không có phân phối chuẩn.
- Biến “DoTuoi”: Kiểm định Shapiro-Wilk cho Sig. = 0.031 < 0.05, nên kết luận dữ liệu không có phân phối chuẩn. Tuy nhiên, nếu nhìn vào biểu đồ Histogram và Q-Q plot, dữ liệu có thể chỉ lệch nhẹ khỏi phân phối chuẩn.
- Biến “ThuNhap”: Kiểm định Shapiro-Wilk cho Sig. = 0.300 > 0.05, kết luận dữ liệu có phân phối chuẩn.

Lưu Ý Khi Sử Dụng Kiểm Định Shapiro-Wilk
- Cỡ mẫu lớn: Khi dữ liệu có cỡ mẫu lớn, một số độ lệch nhỏ khỏi phân phối chuẩn có thể vẫn bị báo là không chuẩn bởi Kiểm định Shapiro-Wilk. Vì vậy, không nên chỉ dựa vào kết quả kiểm định mà cần kết hợp với các công cụ khác như Histogram, Q-Q plot, và các chỉ số Skewness và Kurtosis.
- Kiểm định Kolmogorov-Smirnov: Đối với cỡ mẫu lớn, kết quả từ kiểm định Kolmogorov-Smirnov cũng có thể giúp đánh giá tính chuẩn của dữ liệu. Tuy nhiên, trong trường hợp có sự mâu thuẫn giữa hai kiểm định, ưu tiên kết luận từ Shapiro-Wilk vì độ nhạy cao hơn.
Kết Luận
Kiểm định Shapiro-Wilk là công cụ mạnh mẽ để kiểm tra phân phối chuẩn của dữ liệu, đặc biệt hữu ích với cỡ mẫu nhỏ. Tuy nhiên, với cỡ mẫu lớn, cần kết hợp kiểm định với các phương pháp trực quan như Histogram và Q-Q plot để đưa ra kết luận chính xác về phân phối chuẩn. Khi cỡ mẫu lớn hơn 50, bạn cũng có thể sử dụng Kolmogorov-Smirnov, nhưng Shapiro-Wilk vẫn là lựa chọn ưu tiên trong nhiều trường hợp.
Để tìm hiểu thêm về Kiểm định Shapiro-Wilk và các kiểm định khác trong SPSS, hãy liên hệ với chayspss.com. Chúng tôi luôn sẵn sàng hỗ trợ bạn trong việc xử lý và phân tích dữ liệu chính xác và hiệu