Durbin Watson là một chỉ tiêu quen thuộc khi kiểm tra mô hình hồi quy, đặc biệt trong các nghiên cứu sử dụng dữ liệu chuỗi thời gian hoặc dữ liệu có khả năng xuất hiện mối liên hệ giữa sai số ở các quan sát liền kề. Mục đích chính của chỉ số này là giúp người phân tích nhận biết phần dư của mô hình có đang độc lập với nhau hay không. Nếu phần dư có tự tương quan, kết quả ước lượng có thể vẫn cho ra hệ số hồi quy, nhưng độ tin cậy của suy luận thống kê sẽ bị ảnh hưởng.

Nói đơn giản, khi mô hình hồi quy tốt, phần dư nên phân tán ngẫu nhiên. Ngược lại, nếu sai số của quan sát trước có xu hướng kéo theo sai số của quan sát sau, mô hình đang vi phạm giả định độc lập của phần dư. Đó là lý do hệ số Durbin watson trong hồi quy thường được xem như một bước kiểm tra quan trọng trước khi diễn giải kết quả.

Nội dungGiải thích ngắn
durbin watson là gìLà chỉ số dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất giữa các phần dư trong mô hình hồi quy.
Khoảng giá trịBiến thiên từ 0 đến 4.
DW xấp xỉ 2Phần dư gần như không có tự tương quan bậc nhất.
DW nhỏ hơn 2Cho thấy xu hướng tự tương quan dương.
DW lớn hơn 2Cho thấy xu hướng tự tương quan âm.

Chỉ số Durbin Watson phản ánh điều gì trong mô hình hồi quy?

Ý nghĩa hệ số durbin watson nằm ở chỗ nó giúp người nghiên cứu đánh giá xem sai số của mô hình có còn “dính” với nhau theo thứ tự quan sát hay không. Trong thực hành, điều này rất quan trọng vì nhiều người chỉ quan tâm hệ số hồi quy, Sig. hay R bình phương mà quên mất giả định về phần dư. Một mô hình có hệ số đẹp nhưng phần dư bị tự tương quan thì kết luận vẫn có thể thiếu chắc chắn.

durbin watson test đặc biệt hữu ích khi dữ liệu được sắp xếp theo thời gian như tháng, quý, năm hoặc theo một trình tự có tính liên tục. Khi ấy, sai số ở thời điểm hiện tại có thể bị ảnh hưởng bởi sai số ở thời điểm trước đó. Nếu hiện tượng này tồn tại mà không được xử lý, sai số chuẩn của hệ số ước lượng có thể bị méo, khiến việc kiểm định t hoặc F không còn phản ánh đúng bản chất dữ liệu.

Cách tính hệ số Durbin-Watson

Về mặt công thức, chỉ số durbin watson được tính bằng cách so sánh chênh lệch giữa các phần dư liên tiếp với tổng bình phương phần dư. Biểu thức thường dùng là:

DW = ∑(et – et-1)² / ∑et²

Ký hiệuÝ nghĩa
etPhần dư tại quan sát hoặc thời điểm t
et-1Phần dư tại quan sát ngay trước đó
∑(et – et-1Tổng bình phương chênh lệch giữa các phần dư liền kề
∑et²Tổng bình phương toàn bộ phần dư

Khi các phần dư kề nhau thay đổi mạnh theo hướng độc lập, tử số sẽ tương đối lớn và giá trị DW thường tiến gần 2. Ngược lại, nếu phần dư ở các thời điểm liên tiếp giống nhau hoặc đi cùng một xu hướng, tử số sẽ nhỏ đi và DW có xu hướng thấp hơn 2. Đây là lý do nhiều tài liệu giải thích rằng chỉ số này đo mức độ “trơn” hay “bám đuôi” của chuỗi phần dư.

Giá trị Durbin Watson bao nhiêu là tốt?

Câu hỏi giá trị durbin watson bao nhiêu là tốt thường được người học SPSS đặt ra đầu tiên. Cách hiểu nhanh nhất là giá trị càng gần 2 thì mô hình càng ít có dấu hiệu tự tương quan bậc nhất. Tuy nhiên, chỉ nhìn 2 hay không 2 là chưa đủ. Trong kiểm định chính thức, người phân tích còn phải đối chiếu với các ngưỡng dL và dU trong bảng tra.

Khoảng giá trị DWDiễn giải sơ bộ
Gần 2Phần dư có xu hướng độc lập, đây là trạng thái mong muốn.
Nhỏ hơn 2 khá nhiềuCó khả năng tồn tại tự tương quan dương.
Lớn hơn 2 khá nhiềuCó khả năng tồn tại tự tương quan âm.
Quá gần 0 hoặc quá gần 4Dấu hiệu tự tương quan khá mạnh, cần xem xét kỹ mô hình.

Dù vậy, để kết luận chính xác, bạn không nên chỉ dựa vào cảm giác “gần 2”. Cách làm chuẩn hơn vẫn là dựa vào cách tra bảng durbin watson theo cỡ mẫu, số biến độc lập và mức ý nghĩa lựa chọn.

Cách tra bảng Durbin Watson

durbin watson

Muốn áp dụng kiểm định tự tương quan durbin watson đúng cách, bạn cần xác định trước ba thông tin: mức ý nghĩa alpha, cỡ mẫu n và số biến độc lập k trong mô hình. Sau đó mới tra bảng để lấy hai mốc quan trọng là dL và dU.

BướcViệc cần làmÝ nghĩa
1Chọn mức ý nghĩa alphaTùy tài liệu hoặc quy ước nghiên cứu, có thể dùng các mức khác nhau. Nguyên tắc tra bảng không thay đổi.
2Xác định cỡ mẫu nN là số quan sát thực tế được đưa vào mô hình hồi quy.
3Xác định số biến độc lập kK là số biến giải thích trong mô hình, không tính hằng số.
4Tra bảng để lấy dL và dUĐây là hai ngưỡng dưới và trên phục vụ kết luận.
5So sánh DW với dL, dU, 4-dU, 4-dLTừ đó xác định có tự tương quan dương, âm, không có hay chưa đủ cơ sở kết luận.

Nhiều người học chỉ nhớ mỗi số DW mà quên mất dL và dU. Đây là sai sót khá phổ biến. Trên thực tế, cùng một giá trị DW nhưng với mẫu khác nhau hoặc số biến khác nhau thì kết luận có thể khác nhau. Vì vậy, cách tra bảng durbin watson là bước không nên bỏ qua nếu muốn đọc kết quả một cách chặt chẽ.

Nguyên tắc kết luận sau khi tra bảng

Sau khi có giá trị DW từ phần mềm và lấy được dL, dU từ bảng, bạn áp dụng quy tắc so sánh như sau:

Điều kiện so sánhKết luận
DW < dLCó tự tương quan dương bậc nhất.
dL < DW < dUChưa đủ cơ sở để kết luận.
dU < DW < 4 – dUKhông có tự tương quan bậc nhất.
4 – dU < DW < 4 – dLChưa đủ cơ sở để kết luận về tự tương quan âm.
DW > 4 – dLCó tự tương quan âm bậc nhất.

Nhìn vào bảng trên, bạn sẽ thấy vùng giữa dU và 4 – dU là vùng an toàn nhất. Khi DW nằm trong khoảng này, mô hình không có dấu hiệu tự tương quan chuỗi bậc nhất. Hai vùng giữa dL và dU hoặc giữa 4 – dU và 4 – dL là vùng lưng chừng, nghĩa là chưa thể kết luận chắc chắn.

Đọc hệ số Durbin-Watson trên SPSS như thế nào?

Trong SPSS, chỉ số này thường xuất hiện ở bảng Model Summary khi bạn chạy hồi quy tuyến tính. Người dùng chỉ cần nhìn vào cột Durbin-Watson để lấy giá trị. Tuy nhiên, việc đọc không nên dừng lại ở câu “gần 2 là ổn”. Bạn vẫn cần đối chiếu với cấu trúc mô hình và nếu cần thì tra bảng để kết luận chuẩn hơn.

Ví dụ, nếu mô hình có DW khoảng 1.95 thì đây là một tín hiệu khá tích cực vì giá trị nằm gần 2. Nếu DW chỉ khoảng 0.9 hoặc lên tới 3.2 thì mô hình đã có dấu hiệu đáng ngờ và cần kiểm tra kỹ hơn. Trong các bài nghiên cứu thực tế, phần diễn giải nên viết rõ rằng người nghiên cứu đã kiểm tra tự tương quan bằng chỉ số durbin watson, sau đó nêu kết quả và kết luận tương ứng.

Vì sao tự tương quan lại là vấn đề cần xử lý?

Tự tương quan không nhất thiết làm hệ số hồi quy mất hoàn toàn ý nghĩa, nhưng nó khiến sai số chuẩn bị sai lệch. Khi sai số chuẩn không chuẩn, các kiểm định ý nghĩa thống kê cũng dễ bị sai theo. Bạn có thể tưởng rằng biến độc lập đang có tác động đáng kể, trong khi thực tế kết luận đó bị ảnh hưởng bởi cấu trúc sai số của mô hình.

Ngoài ra, tự tương quan còn cho thấy mô hình có thể đang bỏ sót một phần thông tin quan trọng. Chẳng hạn, mô hình chưa đưa vào biến trễ, chưa phản ánh xu hướng theo thời gian, hoặc dữ liệu có tính mùa vụ nhưng chưa được mô tả đúng. Vì vậy, kiểm định này không chỉ giúp phát hiện lỗi kỹ thuật, mà còn gợi ý rằng mô hình cần được xây dựng lại hợp lý hơn.

Cách xử lý khi mô hình có tự tương quan

Khi kết quả durbin watson cho thấy phần dư đang có tự tương quan, người phân tích có thể cân nhắc một số hướng xử lý dưới đây:

Cách xử lýKhi nào nên nghĩ tớiTác dụng
Bổ sung biến giải thích phù hợpKhi nghi ngờ mô hình bỏ sót yếu tố quan trọngGiảm phần thông tin còn nằm trong sai số
Thêm biến trễKhi dữ liệu có yếu tố thời gian rõ rệtMô tả tốt hơn tác động kéo dài giữa các kỳ
Biến đổi dữ liệuKhi chuỗi có xu hướng hoặc mức biến động không ổn địnhGiúp mô hình bớt phụ thuộc vào cấu trúc chuỗi
Dùng mô hình phù hợp hơn như ARKhi quan hệ theo thời gian là bản chất của dữ liệuXử lý trực tiếp cấu trúc tự tương quan

Không có một công thức xử lý duy nhất cho mọi trường hợp. Điều quan trọng là phải hiểu nguyên nhân vì sao phần dư có liên hệ với nhau. Đôi khi chỉ cần thêm một biến còn thiếu. Nhưng trong nhiều nghiên cứu chuỗi thời gian, bạn cần chuyển sang mô hình chuyên biệt hơn thay vì giữ nguyên hồi quy tuyến tính thông thường.

Kết luận

Hệ số durbin watson là công cụ rất hữu ích để kiểm tra giả định độc lập của phần dư trong hồi quy. Nếu giá trị nằm gần 2 và đồng thời thỏa điều kiện so sánh với dL, dU thì bạn có thể yên tâm hơn rằng mô hình không có tự tương quan bậc nhất. Ngược lại, khi DW lệch xa 2 hoặc rơi vào vùng nghi ngờ, cần xem lại cấu trúc mô hình trước khi diễn giải kết quả sâu hơn.

Hiểu đúng chỉ số durbin watson, biết cách tra bảng, nắm ý nghĩa hệ số durbin watson và cách xử lý khi có vi phạm sẽ giúp bạn đọc output chính xác hơn thay vì chỉ nhìn vào Sig. hay R bình phương. Nếu bạn đang thực hành SPSS, EViews hoặc các bài phân tích hồi quy trong học tập và nghiên cứu, nên xem đây là một bước kiểm tra bắt buộc để đảm bảo chất lượng mô hình. Trong quá trình cần hỗ trợ thêm, bạn có thể tham khảo nội dung hướng dẫn tại chayspss để có thêm kinh nghiệm thực hành với dữ liệu thực tế.

Chạy Phần Mềm: Hỗ trợ chạy phần mềm SPSS, AMOS, SMARTPLS, STATA/ EVIEWS

Xử Lý Số Liệu: Hỗ trợ xử lý số liệu SPSS

Bài viết này hữu ích với bạn?

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *