Trong lĩnh vực nghiên cứu khoa học, việc xác định và hiểu rõ các biến số trong nghiên cứu khoa học là yếu tố then chốt, quyết định sự thành công của một công trình. Các biến số không chỉ là đặc tính có thể thay đổi giữa các đối tượng hay theo thời gian mà còn là nền tảng để xây dựng thiết kế nghiên cứu, lựa chọn phương pháp phân tích, và diễn giải kết quả thống kê một cách chính xác. Bài viết này sẽ đi sâu vào khái niệm biến số, phân loại, tầm quan trọng, quy trình xác định, và đặc biệt là cách ứng dụng them trong các phần mềm thống kê phổ biến như SPSS, AMOS, SmartPLS, STATA/EVIEWS, giúp bạn đọc có cái nhìn toàn diện và thực tiễn nhất.
1. Khái Niệm Cốt Lõi về Biến Số trong Nghiên Cứu Khoa Học
1.1. Biến Số là gì?
Biến số trong nghiên cứu khoa học là bất kỳ đặc tính nào của một cá nhân, một sự vật, một sự kiện hay một hiện tượng có thể nhận các giá trị khác nhau. Ví dụ, trong một nghiên cứu về sức khỏe, “tuổi”, “giới tính”, “huyết áp”, “mức độ hoạt động thể chất” đều là các biến số. Mỗi biến số này có thể thay đổi từ người này sang người khác, hoặc ở cùng một người nhưng thay đổi theo thời gian.
Trong nghiên cứu, các biến số được lựa chọn cẩn thận để quan sát, đo lường, so sánh và phân tích nhằm trả lời các câu hỏi nghiên cứu cụ thể. Việc xác định đúng các biến số giúp nhà nghiên cứu thu thập thông tin có ý nghĩa, đồng thời chọn lựa các test thống kê thích hợp và cách trình bày số liệu hiệu quả.
1.2. Phân biệt Biến Số và Chỉ Số Nghiên Cứu
Đôi khi, khái niệm “biến số” và “chỉ số” có thể gây nhầm lẫn. Chỉ số nghiên cứu thường là sự kết hợp của một hay nhiều biến số để tạo ra một giá trị đo lường có ý nghĩa hơn, nhằm phản ánh một khía cạnh phức tạp hơn của đối tượng nghiên cứu. Một ví dụ điển hình là chỉ số BMI (Body Mass Index), được tính toán từ hai biến số: cân nặng và chiều cao. Trong y học công cộng, một số chỉ số có thể chỉ cần một biến số để đánh giá (ví dụ: tỷ lệ tử vong sơ sinh chỉ cần biến “số trẻ tử vong dưới 1 tuổi” và “tổng số trẻ sinh ra sống trong năm”), nhưng phần lớn các chỉ số phức tạp hơn đều yêu cầu kết hợp nhiều biến số.
2. Phân Loại Biến Số: Nền Tảng cho Thiết Kế Nghiên Cứu
Việc phân loại biến số trong nghiên cứu khoa học giúp nhà nghiên cứu cấu trúc dữ liệu và lựa chọn phương pháp phân tích phù hợp. Có hai cách phân loại chính thường gặp: theo bản chất của biến số và theo vai trò của biến số trong mô hình nghiên cứu.
2.1. Phân Loại theo Bản Chất của Biến Số
2.1.1. Biến Định Lượng
Biến định lượng là những biến có thể biểu diễn bằng số và có đơn vị đo lường rõ ràng. Chúng cho phép thực hiện các phép tính số học.
- Biến rời rạc: Là biến chỉ có thể nhận các giá trị nguyên, không thể là số thập phân giữa hai giá trị liên tiếp. Ví dụ: số con trong gia đình, số bệnh nhân nhập viện.
- Biến liên tục: Là biến có thể nhận bất kỳ giá trị nào trong một khoảng nào đó, kể cả các giá trị thập phân. Ví dụ: chiều cao, cân nặng, thu nhập, tuổi.
2.1.2. Biến Định Tính
Biến định tính là những biến biểu diễn bằng nhóm, loại hoặc thuộc tính, không thể đo lường bằng số theo nghĩa thông thường.
- Biến danh mục (Nominal): Các giá trị của biến chỉ thể hiện sự khác biệt về tên gọi, không có thứ tự hay cấp bậc. Ví dụ: giới tính (nam, nữ), nhóm máu (A, B, AB, O), tình trạng hôn nhân (độc thân, có gia đình).
- Biến thứ hạng (Ordinal): Các giá trị của biến có thứ tự hoặc cấp bậc, nhưng khoảng cách giữa các giá trị có thể không bằng nhau hoặc không có ý nghĩa định lượng. Ví dụ: mức độ hài lòng (rất không hài lòng, không hài lòng, bình thường, hài lòng, rất hài lòng), trình độ học vấn (phổ thông, cao đẳng, đại học, sau đại học).
- Biến nhị phân (Dichotomous/Binary): Là một dạng đặc biệt của biến định tính chỉ có hai giá trị. Ví dụ: có/không, đúng/sai, thành công/thất bại.
2.2. Phân Loại theo Vai trò trong Mô hình Nghiên Cứu
Đây là cách phân loại rất quan trọng để xác định mối quan hệ nhân quả hoặc mối liên hệ giữa các biến số trong nghiên cứu khoa học.
2.2.1. Biến Độc Lập
Biến độc lập (hay biến nguyên nhân, biến giải thích) là yếu tố được cho là gây ra sự thay đổi ở một biến khác. Trong nghiên cứu thực nghiệm, đây là biến mà nhà nghiên cứu chủ động kiểm soát hoặc thay đổi để quan sát tác động của nó. Ví dụ, trong nghiên cứu về hiệu quả của một loại thuốc mới, liều lượng thuốc được sử dụng là biến độc lập.
2.2.2. Biến Phụ Thuộc
Biến phụ thuộc (hay biến kết quả, biến đầu ra) là biến mà nhà nghiên cứu quan tâm và đo lường sự thay đổi của nó, nhằm xem xét tác động từ biến độc lập. Đây là biến kết quả của mối quan hệ nhân quả. Tiếp tục với ví dụ trên, mức độ cải thiện bệnh sau khi dùng thuốc sẽ là biến phụ thuộc.
2.2.3. Biến Kiểm Soát và Biến Nhiễu
- Biến kiểm soát: Là những biến mà nhà nghiên cứu giữ ổn định hoặc loại bỏ ảnh hưởng của chúng để đảm bảo rằng mối quan hệ giữa biến độc lập và biến phụ thuộc không bị sai lệch bởi các yếu tố bên ngoài. Ví dụ, trong nghiên cứu về thuốc, độ tuổi của bệnh nhân có thể là biến kiểm soát.
- Biến nhiễu: Là biến có liên quan cả với biến độc lập và biến phụ thuộc, nhưng không nằm trong cơ chế tác động trực tiếp mà nhà nghiên cứu đang quan tâm. Nếu không được kiểm soát, biến nhiễu có thể dẫn đến kết luận sai lệch về mối quan hệ giữa biến độc lập và biến phụ thuộc. Ví dụ: trong nghiên cứu về mối liên hệ giữa hút thuốc và ung thư phổi, tuổi tác có thể là biến nhiễu vì người lớn tuổi có khả năng hút thuốc lâu năm hơn và cũng có nguy cơ mắc ung thư phổi cao hơn.
3. Tầm Quan Trọng của Việc Xác Định Chính Xác Biến Số
Việc xác định các biến số trong nghiên cứu khoa học một cách chính xác có ý nghĩa sống còn đối với toàn bộ quá trình nghiên cứu. Nó không chỉ định hướng việc thực hiện mà còn đảm bảo tính hợp lệ và tin cậy của kết quả.
3.1. Định Hướng Thu Thập Dữ Liệu
Chỉ khi xác định rõ các biến số cần thiết, nhà nghiên cứu mới biết được thông tin cần thu thập để đạt được mục tiêu nghiên cứu. Điều này bao gồm việc xác định các câu hỏi khảo sát, các chỉ số lâm sàng cần đo, hoặc các dữ liệu kinh tế cần tổng hợp. Thiếu sự rõ ràng trong việc định nghĩa biến số sẽ dẫn đến việc thu thập dữ liệu thiếu hoặc thừa, gây lãng phí nguồn lực và tăng rủi ro sai sót.
3.2. Quyết Định Phương Pháp Thu Thập và Công Cụ
Loại biến số sẽ quyết định phương pháp và công cụ thu thập số liệu phù hợp. Ví dụ, biến định lượng như huyết áp cần máy đo chuyên dụng, trong khi biến định tính như mức độ hài lòng có thể thu thập qua thang đo Likert trong bảng hỏi.
3.3. Hỗ Trợ Tính Toán Chỉ Số Cần Thiết
Như đã đề cập, many chỉ số quan trọng được xây dựng từ nhiều biến số. Việc xác định các biến số thành phần giúp nhà nghiên cứu dễ dàng tính toán chỉ số cần thiết một cách chính xác.
3.4. Hướng Dẫn Lựa Chọn Phép Kiểm Thống Kê và Diễn Giải Kết Quả
Đây là vai trò cực kỳ quan trọng. Loại biến số (định tính hay định lượng, độc lập hay phụ thuộc) ảnh hưởng trực tiếp đến việc lựa chọn phép kiểm thống kê phù hợp và cách trình bày số liệu. Một sự lựa chọn sai lầm có thể dẫn đến kết luận nghiên cứu không chính xác. Chẳng hạn, nếu bạn có một biến phụ thuộc định tính nhị phân, bạn sẽ không thể sử dụng hồi quy tuyến tính mà phải dùng hồi quy logistic.
4. Quy Trình Xác Định Biến Số trong Nghiên Cứu
Để đảm bảo tính khoa học và hiệu quả, việc xác định các biến số trong nghiên cứu khoa học cần tuân thủ một quy trình có hệ thống.
Bước 1: Xác Định Mục Tiêu Nghiên Cứu hoặc Câu Hỏi Nghiên Cứu
Đây là bước khởi đầu. Mục tiêu hoặc câu hỏi nghiên cứu sẽ chỉ ra những gì cần được khám phá hoặc chứng minh. Ví dụ: “Nghiên cứu mối liên hệ giữa thời gian học online và kết quả học tập của sinh viên đại học”.
Bước 2: Liệt Kê Các Thông Tin Cần Thu Thập
Từ mục tiêu đã xác định, bạn cần liệt kê tất cả các thông tin tiềm năng có thể giúp trả lời câu hỏi nghiên cứu. Trong ví dụ trên, các thông tin có thể là: thời gian học online trung bình mỗi ngày, điểm thi cuối kỳ, chuyên ngành học, độ tuổi, giới tính, v.v.
Bước 3: Phân Loại Biến theo Bản Chất và Vai trò
Sau khi liệt kê, tiến hành phân loại các thông tin này thành các biến số cụ thể. Đây là lúc bạn xác định đâu là biến độc lập, đâu là biến phụ thuộc, và đâu là những biến kiểm soát hay biến nhiễu cần lưu ý. Đồng thời, xác định loại biến là định tính hay định lượng.
- Ví dụ:
- Biến độc lập: Thời gian học online (định lượng, liên tục)
- Biến phụ thuộc: Kết quả học tập (có thể định lượng như điểm trung bình, hoặc định tính thứ hạng như: kém, trung bình, khá, giỏi)
- Biến kiểm soát: Chuyên ngành học (định tính danh mục), độ tuổi (định lượng rời rạc), giới tính (định tính nhị phân).
Bước 4: Xác Định Thang Đo và Cách Mã Hóa Biến
Mỗi biến cần có một thang đo rõ ràng và cách mã hóa cụ thể trước khi nhập liệu.
- Thang đo: Ví dụ, thời gian học online có thể đo bằng giờ/ngày; kết quả học tập có thể đo bằng điểm từ 0-10, hoặc thang đo Likert 5 mức độ.
- Mã hóa: Biến giới tính có thể mã hóa: 1 = Nam, 0 = Nữ. Mức độ hài lòng: 1 = Rất không hài lòng, …, 5 = Rất hài lòng.
Bước 5: Chọn Phương Pháp Phân Tích Thống Kê Phù Hợp
Dựa trên loại biến và thiết kế nghiên cứu, bạn sẽ chọn phương pháp phân tích thống kê thích hợp. Ví dụ: nếu biến phụ thuộc là định lượng và biến độc lập là định lượng, có thể sử dụng hồi quy tuyến tính. Nếu biến phụ thuộc là định tính và biến độc lập là định tính, có thể sử dụng kiểm định Chi-bình phương.
Bước 6: Xây Dựng Bảng Biến
Tạo một bảng biến chi tiết, bao gồm: tên biến, định nghĩa rõ ràng, mã hóa, đơn vị đo (nếu có), nguồn thu thập dữ liệu và phương pháp xử lý dự kiến. Bảng này sẽ là bản đồ cho toàn bộ quá trình thu thập và phân tích dữ liệu.
5. Liên Hệ Biến Số với Lựa Chọn Phương Pháp Phân Tích
Sự lựa chọn phương pháp phân tích thống kê phụ thuộc rất nhiều vào loại biến số trong nghiên cứu khoa học và mối quan hệ giữa chúng.
5.1. Gợi Ý Lựa Chọn Test theo Loại Biến
- Biến Danh Mục: Thường được phân tích bằng kiểm định chi-bình phương (χ2) để kiểm tra mối liên hệ giữa các biến định tính. Nếu kích thước mẫu nhỏ, có thể dùng test chính xác Fisher. Đối với dữ liệu ghép cặp (ví dụ: trước/sau can thiệp trên cùng một nhóm), có thể sử dụng McNemar test.
- Biến Thứ Hạng: Nếu so sánh hai nhóm độc lập, sử dụng Mann-Whitney U test. Nếu so sánh nhiều hơn hai nhóm độc lập, sử dụng Kruskal-Wallis test. Đối với dữ liệu ghép cặp hoặc trong cùng một nhóm, sử dụng Wilcoxon signed-rank test (hai mẫu liên quan) hoặc Friedman test (nhiều mẫu liên quan).
- Biến Định Lượng:
- So sánh trung bình hai nhóm độc lập: Independent-samples t-test.
- So sánh trung bình hai nhóm phụ thuộc (ghép cặp): Paired-samples t-test.
- So sánh trung bình từ ba nhóm độc lập trở lên: ANOVA (Analysis of Variance).
- Nếu dữ liệu định lượng không thỏa mãn giả định phân phối chuẩn hoặc phương sai đồng nhất, có thể cân nhắc các kiểm định phi tham số tương ứng như trên.
5.2. Nguyên Tắc Thực Hành
- Luôn chọn test dựa trên loại biến, số nhóm so sánh, và kiểu quan sát (độc lập hay ghép cặp).
- Kiểm tra các giả định của test thống kê (ví dụ: phân phối chuẩn, đồng nhất phương sai) trước khi áp dụng. Nếu dữ liệu không thỏa giả định, cân nhắc kiểm định phi tham số hoặc các phương pháp chuyển đổi dữ liệu.
- With các biến định lượng cần xem xét mối quan hệ, các phân tích hồi quy (hồi quy tuyến tính, hồi quy logistic) là lựa chọn phổ biến, tùy thuộc vào bản chất của biến phụ thuộc.
6. Cách Sử Dụng SPSS với Biến Số trong Nghiên Cứu Khoa Học
SPSS (Statistical Package for the Social Sciences) là một công cụ mạnh mẽ để xử lý các biến số trong nghiên cứu khoa học, từ mã hóa đến phân tích phức tạp.
6.1. Quy Trình Làm Việc trong SPSS
-
Khai báo biến trong Variable View: Đây là bước cực kỳ quan trọng ảnh hưởng đến toàn bộ quá trình phân tích sau này. Bạn cần định nghĩa rõ ràng:
- Name: Tên biến (không chứa khoảng trắng).
- Type: Loại biến (Numeric, String, Date, v.v. – thường là Numeric).
- Labels: Nhãn biến (định nghĩa đầy đủ hơn về biến).
- Values: Mã hóa giá trị cho biến định tính (ví dụ: 1 = Nam, 2 = Nữ).
- Missing: Định nghĩa giá trị thiếu.
- Measure: Thang đo (Scale cho biến định lượng; Ordinal cho biến thứ hạng; Nominal cho biến danh mục).
- Nhập dữ liệu trong Data View: Nhập các giá trị đã thu thập theo các biến đã khai báo.
- Chạy thống kê mô tả: Sử dụng Analyze > Descriptive Statistics > Frequencies hoặc Descriptives để hiểu phân bố của từng biến. Kiểm tra giá trị trung bình, độ lệch chuẩn, tần suất, phần trăm, giá trị ngoại lai.
- Kiểm tra giả định: Trước khi thực hiện các kiểm định suy luận, kiểm tra giả định của chúng (ví dụ: kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov cho phân phối chuẩn, Levene’s test cho đồng nhất phương sai).
- Thực hiện kiểm định phù hợp: Dựa vào bản chất của các biến số trong nghiên cứu khoa học và mục tiêu, chọn kiểm định thích hợp từ menu Analyze.
6.2. Cách Đọc Kết Quả SPSS
- Descriptive Statistics: Đọc giá trị trung bình (Mean), độ lệch chuẩn (Standard Deviation), giá trị lớn nhất (Maximum), nhỏ nhất (Minimum) cho biến định lượng. Đọc tần suất (Frequency), phần trăm (Percent) cho biến định tính để mô tả mẫu.
- Sig. / p-value: Trong hầu hết các kiểm định giả thuyết, nếu p-value < 0.05 (hoặc mức ý nghĩa bạn chọn), kết quả được coi là có ý nghĩa thống kê.
- Levene’s test: Khi chạy t-test hoặc ANOVA, kiểm tra Levene’s Test for Equality of Variances trước. Nếu Sig. < 0.05, giả định phương sai đồng nhất bị vi phạm, và bạn cần đọc hàng kết quả Equal variances not assumed.
- Model Summary / ANOVA / Coefficients (trong hồi quy):
- Model Summary: R-squared (R2) cho biết phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
- ANOVA: Sig. cho biết mô hình hồi quy tổng thể có ý nghĩa thống kê hay không.
- Coefficients: Đọc Beta (hệ số hồi quy) để biết chiều và mức độ ảnh hưởng của từng biến độc lập lên biến phụ thuộc, cùng với Sig. (p-value) để đánh giá ý nghĩa thống kê của từng hệ số.
Ví dụ thực tiễn với SPSS: Giả sử bạn muốn kiểm tra xem có sự khác biệt về mức độ hài lòng về chất lượng dịch vụ (biến định lượng) giữa hai nhóm giới tính (biến định tính nhị phân: Nam/Nữ). Bạn sẽ sử dụng Independent-samples t-test.
- Khai báo biến: gioi_tinh (Nominal, 1=Nam, 0=Nữ), muc_do_hai_long (Scale).
- Chạy phân tích: Analyze > Compare Means > Independent-Samples T-Test. Đưa muc_do_hai_long vào Test Variable(s) và gioi_tinh vào Grouping Variable. Định nghĩa nhóm (Define Groups: 0 và 1).
- Đọc kết quả: Đầu tiên, nhìn vào Levene’s test. Nếu Sig. > 0.05, bạn đọc dòng “Equal variances assumed”; nếu Sig. < 0.05, đọc dòng “Equal variances not assumed”. Sau đó, bạn nhìn vào Sig. (2-tailed) của T-test. Nếu giá trị này nhỏ hơn 0.05, bạn kết luận có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng giữa nam và nữ.
7. Biến Số trong AMOS: Mô Hình Đo Lường và Cấu Trúc
AMOS (Analysis of Moment Structures) là phần mềm chuyên dụng cho phân tích mô hình cấu trúc tuyến tính (SEM), thường liên quan đến phân tích nhân tố khẳng định (CFA) và mô hình đường dẫn. Trong AMOS, các biến số trong nghiên cứu khoa học không chỉ là biến quan sát mà còn có khái niệm biến tiềm ẩn.
7.1. Vai Trò của Biến trong AMOS
- Biến quan sát (Observed Variables/Indicators): Các biến được đo lường trực tiếp từ dữ liệu thu thập (ví dụ: các câu hỏi trong bảng khảo sát). Chúng là “bằng chứng” để đo lường các biến tiềm ẩn.
- Biến tiềm ẩn (Latent Variables/Constructs): Các khái niệm trừu tượng không thể đo lường trực tiếp, mà được suy diễn từ các biến quan sát. Ví dụ: “Sự hài lòng của khách hàng”, “Chất lượng dịch vụ”, “Ý định mua hàng”. Các biến tiềm ẩn này thường được biểu diễn bằng hình bầu dục trong mô hình AMOS.
7.2. Quy Trình Thực Hành AMOS
- Xây dựng mô hình đo lường (Measurement Model): Xác định mối quan hệ giữa các biến quan sát và các biến tiềm ẩn tương ứng (CFA).
- Xây dựng mô hình cấu trúc (Structural Model): Xác định mối quan hệ nhân quả (mũi tên một chiều) giữa các biến tiềm ẩn với nhau.
- Đánh giá độ phù hợp mô hình (Model Fit): Kiểm tra xem mô hình được đề xuất có phù hợp với dữ liệu thực tế hay không.
- Đánh giá độ tin cậy và giá trị: Kiểm tra tải nhân tố (factor loading), độ tin cậy tổng hợp (composite reliability – CR) và phương sai trích trung bình (Average Variance Extracted – AVE) của các biến tiềm ẩn.
7.3. Cách Đọc Kết Quả AMOS
- Chỉ số phù hợp mô hình:
- χ2 / df (C/df): Thường mong muốn < 3 hoặc < 5.
- CFI (Comparative Fit Index), TLI (Tucker-Lewis Index): > 0.9 hoặc > 0.95.
- RMSEA (Root Mean Square Error of Approximation): < 0.08 hoặc < 0.06.
- GFI (Goodness-of-Fit Index): > 0.9.
- Factor Loading: Giá trị tải nhân tố (Regression Weights) cho biết mức độ mà một biến quan sát phản ánh biến tiềm ẩn của nó. Thông thường mong muốn > 0.5, lý tưởng là > 0.7.
- CR và AVE: Được dùng để đánh giá độ tin cậy và giá trị hội tụ của thang đo. CR nên > 0.7 và AVE nên > 0.5. Sau đó kiểm tra giá trị phân biệt (Discriminant Validity) qua Heterotrait-Monotrait Ratio (HTMT) hoặc bằng cách so sánh căn bậc hai của AVE với tương quan giữa các biến tiềm ẩn.
Ví dụ thực tiễn với AMOS: Giả sử bạn có 3 biến tiềm ẩn: “Chất lượng sản phẩm” (QL_SP), “Giá cả hợp lý” (GIA_CA), và “Sự hài lòng khách hàng” (HAI_LONG), mỗi biến tiềm ẩn được đo bằng 3-4 biến quan sát (ví dụ: QL_SP1, QL_SP2, QL_SP3). Bạn muốn xây dựng mô hình các biến tiềm ẩn này ảnh hưởng đến “Ý định mua lại” (YD_MUA_LAI – cũng là một biến tiềm ẩn).
- Vẽ mô hình: Trong giao diện AMOS, bạn vẽ các hình bầu dục cho biến tiềm ẩn và các hình vuông cho biến quan sát, sau đó nối chúng lại bằng mũi tên.
- CFA: Chạy để xác định các biến quan sát nào thật sự thể hiện biến tiềm ẩn tương ứng. Kiểm tra các factor loading và các chỉ số phù hợp mô hình đo lường. Nếu có biến quan sát có loading thấp (<0.5), có thể cân nhắc loại bỏ.
- SEM: Sau khi mô hình đo lường đạt yêu cầu, bạn thêm các mũi tên tác động từ QL_SP, GIA_CA, HAI_LONG đến YD_MUA_LAI. Chạy phân tích SEM.
- Đọc kết quả: Kiểm tra lại các chỉ số phù hợp mô hình tổng thể. Sau đó, xem tab Estimates > Standardized Regression Weights để xem các hệ số đường dẫn chuẩn hóa (Standardized Path Coefficients) và p-value của chúng để đánh giá mối quan hệ và ý nghĩa thống kê của các tác động.
8. Biến Số trong SmartPLS: PLS-SEM cho Mô Hình Phức Tạp
SmartPLS là một công cụ phổ biến cho PLS-SEM (Partial Least Squares Structural Equation Modeling), đặc biệt hữu ích khi dữ liệu không chuẩn mạnh, kích thước mẫu nhỏ hoặc mô hình của bạn rất phức tạp, và trọng tâm chính là dự báo hơn là khẳng định lý thuyết. Các loại biến số trong nghiên cứu khoa học trong SmartPLS cũng được chia thành biến quan sát và biến tiềm ẩn, nhưng có sự phân biệt rõ ràng hơn về cách các chỉ báo đo lường biến tiềm ẩn.
8.1. Các Dạng Biến Số Nổi Bật trong SmartPLS
- Biến tiềm ẩn phản xạ (Reflective Latent Variables): Phổ biến nhất. Chỉ báo (biến quan sát) là phản ánh của biến tiềm ẩn. Thay đổi ở biến tiềm ẩn gây ra thay đổi ở các chỉ báo, và các chỉ báo này được giả định có mối tương quan với nhau (ví dụ: “Sự hài lòng” dẫn đến “hài lòng với sản phẩm”, “hài lòng với dịch vụ”).
- Biến tiềm ẩn tạo thành (Formative Latent Variables): Chỉ báo là nguyên nhân hoặc thành phần cấu thành nên biến tiềm ẩn. Thay đổi ở các chỉ báo sẽ gây ra thay đổi ở biến tiềm ẩn, và các chỉ báo này không nhất thiết phải tương quan với nhau (ví dụ: “Tình trạng kinh tế xã hội” được tạo thành bởi “thu nhập”, “trình độ học vấn”, “nghề nghiệp”).
- Biến quan sát (Observed Variables/Indicators): Các mục câu hỏi cụ thể được dùng để đo lường các biến tiềm ẩn.
8.2. Quy Trình Thực Hiện với SmartPLS
- Xây dựng mô hình đo lường: Vẽ mô hình trong SmartPLS Design, xác định các biến tiềm ẩn và các chỉ báo của chúng (đặc biệt là phân biệt giữa mô hình phản xạ và tạo thành).
- Đánh giá mô hình đo lường: Tiến hành chạy thuật toán PLS-SEM và kiểm tra các chỉ số cốt lõi. Đối với mô hình phản xạ, kiểm tra Outer Loading (> 0.708), Composite Reliability (CR > 0.7), và Average Variance Extracted (AVE > 0.5) nhằm khẳng định tính hội tụ. Với kiểm tra tính phân biệt, đánh giá qua chỉ số Heterotrait-Monotrait Ratio (HTMT < 0.85 hoặc 0.90).
- Đánh giá mô hình cấu trúc và kiểm định giả thuyết: Chạy thuật toán Bootstrapping nâng cao để xác định giá trị p-value và t-statistic của các hệ số đường dẫn (Path Coefficients). Nếu p-value < 0.05 (hoặc t-statistic > 1.96), giả thuyết tác động được ủng hộ. Đồng thời, đánh giá giá trị R2 để đo lường mức độ giải thích phương sai của biến phụ thuộc.
Kết luận
Làm chủ việc phân loại và thiết lập chính xác các biến số trong nghiên cứu khoa học là nền móng vững chắc nhất giúp bạn làm chủ bộ dữ liệu thực địa của mình. Cho dù bài viết, luận văn hay báo cáo của bạn sử dụng phân tích mô tả cơ bản trên SPSS, kiểm định mô hình xác nhận lý thuyết trên AMOS hay mô hình dự báo cấu trúc trên SmartPLS, việc chọn đúng thang đo và phương pháp chẩn đoán sẽ giúp số liệu đầu ra luôn đạt chuẩn học thuật cao.
Nếu bạn gặp bất kỳ vướng mắc nào trong quá trình khai báo biến, xử lý đa cộng tuyến hay phân tích hệ thống mô hình đa biến nhân quả nâng cao, hãy liên hệ ngay với đội ngũ chuyên gia giàu kinh nghiệm tại xulysolieu.info để được đồng hành và giải đáp số liệu một cách tin cậy nhất hằng ngày.
