Durbin Watson là một chỉ tiêu quen thuộc khi kiểm tra mô hình hồi quy, đặc biệt trong các nghiên cứu sử dụng dữ liệu chuỗi thời gian hoặc dữ liệu có khả năng xuất hiện mối liên hệ giữa sai số ở các quan sát liền kề. Mục đích chính của chỉ số này là giúp người phân tích nhận biết phần dư của mô hình có đang độc lập với nhau hay không. Nếu phần dư có tự tương quan, kết quả ước lượng có thể vẫn cho ra hệ số hồi quy, nhưng độ tin cậy của suy luận thống kê sẽ bị ảnh hưởng.
Nói đơn giản, khi mô hình hồi quy tốt, phần dư nên phân tán ngẫu nhiên. Ngược lại, nếu sai số của quan sát trước có xu hướng kéo theo sai số của quan sát sau, mô hình đang vi phạm giả định độc lập của phần dư. Đó là lý do hệ số Durbin watson trong hồi quy thường được xem như một bước kiểm tra quan trọng trước khi diễn giải kết quả.
| Nội dung | Giải thích ngắn |
|---|---|
| durbin watson là gì | Là chỉ số dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất giữa các phần dư trong mô hình hồi quy. |
| Khoảng giá trị | Biến thiên từ 0 đến 4. |
| DW xấp xỉ 2 | Phần dư gần như không có tự tương quan bậc nhất. |
| DW nhỏ hơn 2 | Cho thấy xu hướng tự tương quan dương. |
| DW lớn hơn 2 | Cho thấy xu hướng tự tương quan âm. |
Chỉ số Durbin Watson phản ánh điều gì trong mô hình hồi quy?
Ý nghĩa hệ số durbin watson nằm ở chỗ nó giúp người nghiên cứu đánh giá xem sai số của mô hình có còn “dính” với nhau theo thứ tự quan sát hay không. Trong thực hành, điều này rất quan trọng vì nhiều người chỉ quan tâm hệ số hồi quy, Sig. hay R bình phương mà quên mất giả định về phần dư. Một mô hình có hệ số đẹp nhưng phần dư bị tự tương quan thì kết luận vẫn có thể thiếu chắc chắn.
durbin watson test đặc biệt hữu ích khi dữ liệu được sắp xếp theo thời gian như tháng, quý, năm hoặc theo một trình tự có tính liên tục. Khi ấy, sai số ở thời điểm hiện tại có thể bị ảnh hưởng bởi sai số ở thời điểm trước đó. Nếu hiện tượng này tồn tại mà không được xử lý, sai số chuẩn của hệ số ước lượng có thể bị méo, khiến việc kiểm định t hoặc F không còn phản ánh đúng bản chất dữ liệu.
Cách tính hệ số Durbin-Watson
Về mặt công thức, chỉ số durbin watson được tính bằng cách so sánh chênh lệch giữa các phần dư liên tiếp với tổng bình phương phần dư. Biểu thức thường dùng là:
DW = ∑(et – et-1)² / ∑et²
| Ký hiệu | Ý nghĩa |
|---|---|
| et | Phần dư tại quan sát hoặc thời điểm t |
| et-1 | Phần dư tại quan sát ngay trước đó |
| ∑(et – et-1)² | Tổng bình phương chênh lệch giữa các phần dư liền kề |
| ∑et² | Tổng bình phương toàn bộ phần dư |
Khi các phần dư kề nhau thay đổi mạnh theo hướng độc lập, tử số sẽ tương đối lớn và giá trị DW thường tiến gần 2. Ngược lại, nếu phần dư ở các thời điểm liên tiếp giống nhau hoặc đi cùng một xu hướng, tử số sẽ nhỏ đi và DW có xu hướng thấp hơn 2. Đây là lý do nhiều tài liệu giải thích rằng chỉ số này đo mức độ “trơn” hay “bám đuôi” của chuỗi phần dư.
Giá trị Durbin Watson bao nhiêu là tốt?
Câu hỏi giá trị durbin watson bao nhiêu là tốt thường được người học SPSS đặt ra đầu tiên. Cách hiểu nhanh nhất là giá trị càng gần 2 thì mô hình càng ít có dấu hiệu tự tương quan bậc nhất. Tuy nhiên, chỉ nhìn 2 hay không 2 là chưa đủ. Trong kiểm định chính thức, người phân tích còn phải đối chiếu với các ngưỡng dL và dU trong bảng tra.
| Khoảng giá trị DW | Diễn giải sơ bộ |
|---|---|
| Gần 2 | Phần dư có xu hướng độc lập, đây là trạng thái mong muốn. |
| Nhỏ hơn 2 khá nhiều | Có khả năng tồn tại tự tương quan dương. |
| Lớn hơn 2 khá nhiều | Có khả năng tồn tại tự tương quan âm. |
| Quá gần 0 hoặc quá gần 4 | Dấu hiệu tự tương quan khá mạnh, cần xem xét kỹ mô hình. |
Dù vậy, để kết luận chính xác, bạn không nên chỉ dựa vào cảm giác “gần 2”. Cách làm chuẩn hơn vẫn là dựa vào cách tra bảng durbin watson theo cỡ mẫu, số biến độc lập và mức ý nghĩa lựa chọn.
Cách tra bảng Durbin Watson

Muốn áp dụng kiểm định tự tương quan durbin watson đúng cách, bạn cần xác định trước ba thông tin: mức ý nghĩa alpha, cỡ mẫu n và số biến độc lập k trong mô hình. Sau đó mới tra bảng để lấy hai mốc quan trọng là dL và dU.
| Bước | Việc cần làm | Ý nghĩa |
|---|---|---|
| 1 | Chọn mức ý nghĩa alpha | Tùy tài liệu hoặc quy ước nghiên cứu, có thể dùng các mức khác nhau. Nguyên tắc tra bảng không thay đổi. |
| 2 | Xác định cỡ mẫu n | N là số quan sát thực tế được đưa vào mô hình hồi quy. |
| 3 | Xác định số biến độc lập k | K là số biến giải thích trong mô hình, không tính hằng số. |
| 4 | Tra bảng để lấy dL và dU | Đây là hai ngưỡng dưới và trên phục vụ kết luận. |
| 5 | So sánh DW với dL, dU, 4-dU, 4-dL | Từ đó xác định có tự tương quan dương, âm, không có hay chưa đủ cơ sở kết luận. |
Nhiều người học chỉ nhớ mỗi số DW mà quên mất dL và dU. Đây là sai sót khá phổ biến. Trên thực tế, cùng một giá trị DW nhưng với mẫu khác nhau hoặc số biến khác nhau thì kết luận có thể khác nhau. Vì vậy, cách tra bảng durbin watson là bước không nên bỏ qua nếu muốn đọc kết quả một cách chặt chẽ.
Nguyên tắc kết luận sau khi tra bảng
Sau khi có giá trị DW từ phần mềm và lấy được dL, dU từ bảng, bạn áp dụng quy tắc so sánh như sau:
| Điều kiện so sánh | Kết luận |
|---|---|
| DW < dL | Có tự tương quan dương bậc nhất. |
| dL < DW < dU | Chưa đủ cơ sở để kết luận. |
| dU < DW < 4 – dU | Không có tự tương quan bậc nhất. |
| 4 – dU < DW < 4 – dL | Chưa đủ cơ sở để kết luận về tự tương quan âm. |
| DW > 4 – dL | Có tự tương quan âm bậc nhất. |
Nhìn vào bảng trên, bạn sẽ thấy vùng giữa dU và 4 – dU là vùng an toàn nhất. Khi DW nằm trong khoảng này, mô hình không có dấu hiệu tự tương quan chuỗi bậc nhất. Hai vùng giữa dL và dU hoặc giữa 4 – dU và 4 – dL là vùng lưng chừng, nghĩa là chưa thể kết luận chắc chắn.
Đọc hệ số Durbin-Watson trên SPSS như thế nào?
Trong SPSS, chỉ số này thường xuất hiện ở bảng Model Summary khi bạn chạy hồi quy tuyến tính. Người dùng chỉ cần nhìn vào cột Durbin-Watson để lấy giá trị. Tuy nhiên, việc đọc không nên dừng lại ở câu “gần 2 là ổn”. Bạn vẫn cần đối chiếu với cấu trúc mô hình và nếu cần thì tra bảng để kết luận chuẩn hơn.
Ví dụ, nếu mô hình có DW khoảng 1.95 thì đây là một tín hiệu khá tích cực vì giá trị nằm gần 2. Nếu DW chỉ khoảng 0.9 hoặc lên tới 3.2 thì mô hình đã có dấu hiệu đáng ngờ và cần kiểm tra kỹ hơn. Trong các bài nghiên cứu thực tế, phần diễn giải nên viết rõ rằng người nghiên cứu đã kiểm tra tự tương quan bằng chỉ số durbin watson, sau đó nêu kết quả và kết luận tương ứng.
Vì sao tự tương quan lại là vấn đề cần xử lý?
Tự tương quan không nhất thiết làm hệ số hồi quy mất hoàn toàn ý nghĩa, nhưng nó khiến sai số chuẩn bị sai lệch. Khi sai số chuẩn không chuẩn, các kiểm định ý nghĩa thống kê cũng dễ bị sai theo. Bạn có thể tưởng rằng biến độc lập đang có tác động đáng kể, trong khi thực tế kết luận đó bị ảnh hưởng bởi cấu trúc sai số của mô hình.
Ngoài ra, tự tương quan còn cho thấy mô hình có thể đang bỏ sót một phần thông tin quan trọng. Chẳng hạn, mô hình chưa đưa vào biến trễ, chưa phản ánh xu hướng theo thời gian, hoặc dữ liệu có tính mùa vụ nhưng chưa được mô tả đúng. Vì vậy, kiểm định này không chỉ giúp phát hiện lỗi kỹ thuật, mà còn gợi ý rằng mô hình cần được xây dựng lại hợp lý hơn.
Cách xử lý khi mô hình có tự tương quan
Khi kết quả durbin watson cho thấy phần dư đang có tự tương quan, người phân tích có thể cân nhắc một số hướng xử lý dưới đây:
| Cách xử lý | Khi nào nên nghĩ tới | Tác dụng |
|---|---|---|
| Bổ sung biến giải thích phù hợp | Khi nghi ngờ mô hình bỏ sót yếu tố quan trọng | Giảm phần thông tin còn nằm trong sai số |
| Thêm biến trễ | Khi dữ liệu có yếu tố thời gian rõ rệt | Mô tả tốt hơn tác động kéo dài giữa các kỳ |
| Biến đổi dữ liệu | Khi chuỗi có xu hướng hoặc mức biến động không ổn định | Giúp mô hình bớt phụ thuộc vào cấu trúc chuỗi |
| Dùng mô hình phù hợp hơn như AR | Khi quan hệ theo thời gian là bản chất của dữ liệu | Xử lý trực tiếp cấu trúc tự tương quan |
Không có một công thức xử lý duy nhất cho mọi trường hợp. Điều quan trọng là phải hiểu nguyên nhân vì sao phần dư có liên hệ với nhau. Đôi khi chỉ cần thêm một biến còn thiếu. Nhưng trong nhiều nghiên cứu chuỗi thời gian, bạn cần chuyển sang mô hình chuyên biệt hơn thay vì giữ nguyên hồi quy tuyến tính thông thường.
Kết luận
Hệ số durbin watson là công cụ rất hữu ích để kiểm tra giả định độc lập của phần dư trong hồi quy. Nếu giá trị nằm gần 2 và đồng thời thỏa điều kiện so sánh với dL, dU thì bạn có thể yên tâm hơn rằng mô hình không có tự tương quan bậc nhất. Ngược lại, khi DW lệch xa 2 hoặc rơi vào vùng nghi ngờ, cần xem lại cấu trúc mô hình trước khi diễn giải kết quả sâu hơn.
Hiểu đúng chỉ số durbin watson, biết cách tra bảng, nắm ý nghĩa hệ số durbin watson và cách xử lý khi có vi phạm sẽ giúp bạn đọc output chính xác hơn thay vì chỉ nhìn vào Sig. hay R bình phương. Nếu bạn đang thực hành SPSS, EViews hoặc các bài phân tích hồi quy trong học tập và nghiên cứu, nên xem đây là một bước kiểm tra bắt buộc để đảm bảo chất lượng mô hình. Trong quá trình cần hỗ trợ thêm, bạn có thể tham khảo nội dung hướng dẫn tại chayspss để có thêm kinh nghiệm thực hành với dữ liệu thực tế.
Chạy Phần Mềm: Hỗ trợ chạy phần mềm SPSS, AMOS, SMARTPLS, STATA/ EVIEWS
Xử Lý Số Liệu: Hỗ trợ xử lý số liệu SPSS
