Sau bước hồi quy, chúng ta thường thực hiện phân tích ANOVA và Independent Sample T – Test nhằm kiểm định sự khác biệt giữa các value của biến định tính với biến định lượng.
Ví dụ: Chúng ta sẽ đánh giá xem có sự khác biệt hay không về sự hài lòng trong công việc giữa nhân viên nam và nhân viên nữ, giữa nhân viên thu nhập cao với thu nhập thấp , giữa phòng marketing và phòng kế toán ....v..v... Để thực hiện được điều này chúng ta tiến hành phân tích phương sai ANOVA và Independent Sample T – Test. Sự khác biệt có ý nghĩa thống kê với độ tin cậy 95% (hay mức ý nghĩa Sig.< 0.05).
Câu hỏi đặt ra khi nào sẽ thực hiện phân tích phương sai ANOVA và khi nào sẽ sử dụng Independent Sample T – Test? Mình sẽ trình bày chi tiết theo từng mục phía dưới nhé. Tuy nhiên trước mắt, các bạn hãy nắm trước cho mình lý thuyết này:
- Biến định tính hơn 2 value - Dùng ANOVA
- Biến định tính có 2 value - Dùng Independent Sample T - Test
A - PHÂN TÍCH ANOVA
Ví dụ điển hình:
Trên hình ảnh, các bạn có thể thấy biến nhóm tuổi có 5 value, như vậy như câu nói ban đầu của mình, hơn 2 value thì sẽ dùng ANOVA. Để dễ dàng cho việc trình bày, mình sẽ sử dụng biến Tuoi (nhóm tuổi) là biến định tính và biến SHL (sự hài lòng) là biến định lượng.
Cách thực hiện phân tích ANOVA như sau. Vào Analyze > Compare Means > One-Way ANOVA...
Giao diện hiện ra như sau, các bạn đưa biến phụ thuộc vào mục Dependent List, đưa biến định tính vào mục Factor.
Tiếp theo sử dụng tùy chọn Post Hoc để đề phòng trường hợp kiểm định Levene cho giá trị sig < 0.05 (đoạn này bạn sẽ hiểu khi đọc tới cuối bài). Chọn vào mục kiểm định Tamhane's T2 rồi chọn Continue.
Tiếp đến, sử dụng tùy chọn Options. Tích vào 3 mục như hình ảnh phía dưới. Sau đó chọn Continue.
Quay lại giao diện ban đầu, chọn OK để xuất kết quả ra Output:
Bảng bạn quan tâm đầu tiên đó là Test of Homogeneity of Variances, chúng ta sẽ xem xét sig của Levene Statistic.
1/ Trường hợp sig lớn hơn hoặc bằng 0.05
Nếu sig ở kiểm định này > 0.05 thì phương sai giữa các lựa chọn của biến định tính ở trên không khác nhau, xem tiếp kết quả ở bảng ANOVA.
1/ Trường hợp sig lớn hơn hoặc bằng 0.05
Nếu sig ở bảng ANOVA < 0.05, chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.
Nếu sig ở bảng ANOVA >= 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.
2/ Trường hợp sig nhỏ hơn 0.05
Trường hợp sig nhỏ hơn 0.05, chúng ta không sử dụng bảng ANOVA mà sử dụng kết quả kiểm định Post Hoc (thống kê Tamhane's T2). Sơ lược về Post Hoc:
Kiểm định Post Hoc kiểm định sự khác biệt về giá trị trung bình của biến định lượng giữa từng cặp thuộc tính của biến định tính. Nếu ít nhất có một cặp có sự khác biệt về giá trị trung bình (sig < 0.05) theo các thuộc tính của biến định tính thì kết luận có sự khác biệt về giá trị trung bình của biến định lượng theo các thuộc tính của biến định tính.
Các điểm tô vàng trong hình đều có sig nhỏ hơn 0.05. Khi chạy ra bảng này, chỉ cần nhìn vào cột sig các bạn thấy có 1 giá trị < 0.05 thì kết luận ngay: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau
Ngược lại, trường hợp cả cột đều có sig >= 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.
B - KIỂM ĐỊNH INDEPENDENT SAMPLE T-TEST
Ví dụ điển hình:
Trên hình ảnh, các bạn có thể thấy biến giới tính có 2 value, như vậy như câu nói ban đầu của mình, 2 value thì sẽ dùng Independent Sample T - Test. Để dễ dàng cho việc trình bày, mình sẽ sử dụng biến Gioi_tinh (giới tính) là biến định tính và biến SHL (sự hài lòng) là biến định lượng.
Cách thực hiện kiểm định như sau. Vào Analyze > Compare Means > Independent Sample T-Test...
Ở giao diện được mở ra, các bạn đưa biến định lượng vào mục Test Variable (s), đưa biến định tính vào mục Grouping Variable. Sau đó nhấn vào mục Define Groups... ngay bên dưới.
Tại đây, các bạn sẽ phân nhóm giá trị ra. Biến giới tính của chúng ta có 2 value: 1 là nam, 2 là nữ, do vậy các bạn sẽ điền 2 số này vào 2 ô trống, không cần phải sắp xếp 1 đến 2, có thể điền 2, 1 cũng được, không sao cả nhé. Sau đó nhấn vào Continue.
Trở lại giao diện ban đầu, nhấn OK để xuất kết quả ra Output.
Chúng ta sẽ quan tâm tới bảng Independent Samples Test. Giá trị đầu tiên là sig của Levene's Test (điểm màu vàng).
1/ Trường hợp sig nhỏ hơn 0.05
Nếu sig Levene's Test nhỏ hơn 0.05 thì phương sai giữa 2 giới tính là khác nhau, chúng ta sẽ sử dụng giá trị sig T-Test màu hồng ở hàng Equal variances not assumed.
- Giá trị sig T-Test < 0.05 chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.
- Giá trị sig T-Test >= 0.05 chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.
2/ Trường hợp sig lớn hơn hoặc bằng 0.05
Nếu sig Levene's Test lớn hơn hoặc bằng 0.05 thì phương sai giữa 2 giới tính là không khác nhau, chúng ta sẽ sử dụng giá trị sig T-Test màu xanh ở hàng Equal variances assumed.
- Giá trị sig T-Test < 0.05 chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.
- Giá trị sig T-Test >= 0.05 chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.
Nguồn bài viết tại Blog của Phạm Lộc http://www.phamlocblog.com/2016/03/phan-tich-anova-trong-spss.html
Nguồn bài viết tại Blog của Phạm Lộc http://www.phamlocblog.com/2016/03/phan-tich-anova-trong-spss.html
0 nhận xét:
Đăng nhận xét