QUY TRÌNH XỬ LÝ SỐ LIỆU THỐNG KÊ BẰNG SPSS TRONG CÁC LUẬN VĂN, LUẬN ÁN QUẢN LÝ GIÁO DỤC, EFA-MÔ HÌNH KHÁM PHÁ VÀ MÔ HÌNH HỒI QUY ĐA BIẾN-MRA (Exploratory Factor Analysis and Multiple Regression Analysis)-P3

Đăng bởi Hoanglien vào

CHƯƠNG 2

KIỂM ĐỊNH VÀ XỬ LÝ DỮ LIỆU THỐNG KÊ BẰNG SPSS THEO MÔ HÌNH KHÁM PHÁ EFA VÀ MÔ HÌNH HỒI QUY ĐA BIẾN MRA TRONG LUẬN VĂN, LUẬN ÁN ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ KHOA HỌC QLGD

 2.1. KIỂM ĐỊNH VÀ XỬ LÝ DỮ LIỆU THỐNG KÊ BẰNG SPSS THEO MÔ HÌNH KHÁM PHÁ EFA VÀ MÔ HÌNH HỒI QUY ĐA BIẾN MRA

2.1.1 Giới thiệu đôi nét về SPSS

SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. Phần mềm SPSS hỗ trợ xử lý và phân tích dữ liệu sơ cấp – là các thông tin được thu thập trực tiếp từ đối tượng nghiên cứu, thường được sử dụng rộng rãi trong các nghiên cứu điều tra xã hội học  kinh tế lượng.

Năm 1968 tại Đại học Stanford, nhà nghiên cứu xã hội học Norman H.Nie và hai nghiên cứu sinh tiến sĩ C. Hadlai (Tex) Hull, Dale H. Ben thực hiện dự án phát triển một hệ thống phần mềm dựa trên ý tưởng của việc sử dụng dữ liệu thô từ số liệu thống kê chuyển thành thông tin cần thiết cho việc ra quyết định dành cho nhà quản lý. Hệ thống phần mềm được lấy tên từ viết tắt của “Statistical Package for the Social Sciences” gọi là phần mềm SPSS.

Năm 1975, Công ty SPSS Inc được thành lập nhằm thương mại hoá phần mềm này. Các thế hệ đầu tiên của SPSS chỉ sử dụng cho các máy chủ do năng lực tính toán của các máy tính cá nhân còn hạn chế.

SPSS được giới thiệu như là các phần mềm thống kê đầu tiên cho máy tính, làm việc trên nền tảng MS-DOS (năm 1984), Microsoft Windows 3.1 (năm 1992). Phiên bản thế hệ 18 được giới thiệu vào tháng 8 năm 2008, có phiên bản cho các hệ điều hành Microsoft Windows, Mac, và Linux / UNIX.

Ngày 28 tháng 7 năm 2009, công ty PASW (Predictive Analytics SoftWare Statistics) sở hữu phần mềm này đã được IBM mua lại với giá 1,2 tỷ đô la.[1] Đến tháng 1 năm 2010, thương hiệu của phần mềm được đổi thành “SPSS: An IBM Company”, nêu rõ SPSS thuộc về IBM.

Theo IBM, Điều gì sẽ xảy ra nếu bạn có được những hiểu biết sâu sắc hơn, có ý nghĩa hơn từ dữ liệu của bạn và dự đoán điều gì sẽ xảy ra tiếp theo? Phần mềm phân tích tiên đoán của IBM SPSS cung cấp các kỹ thuật tiên tiến trong một gói dễ sử dụng để giúp bạn tìm ra các cơ hội mới, nâng cao hiệu quả và giảm thiểu rủi ro.

Mục tiêu của SPSS là Giải quyết toàn bộ quá trình phân tích: lập kế hoạch, thu thập dữ liệu, phân tích, báo cáo và triển khai. Đặc điểm của SPSS là Mô hình dự đoán và khai thác dữ liệu.Tính năng của SPSS là Sử dụng các tính năng xây dựng mô hình, đánh giá và tự động hóa mạnh mẽ.Ý nghĩa: Kích hoạt tính năng phân tích của bạn với quản lý mô hình tiên tiến và quản lý quyết định phân tích trên nền tảng của đám mây đồng thời phân tích các dữ liệu lớn để có được những hiểu biết tiên đoán và xây dựng các chiến lược quản lý, kinh doanh hiệu quả.

Nguồn: wikipedia

2.1.2. Kiểm định và xử lý dữ liệu thống kê bằng SPSS theo mô hình khám phá EFA

Mô hình phân tích nhân tố khám phá (Exploratory Factor Analysis, EFA) thường được sử dụng để thu nhỏ và tóm tắt các dữ liệu thống kê của một mô hình nghiên cứu nào đó. Nói một cách cụ thể, từ một tập hợp n biến quan sát độc lập  được rút gọn thành một tập k nhân tố độc lập  dựa trên mối quan hệ tuyến tính giữa các biến quan sát độc lập với nhau (còn gọi là có tương quan với nhau).

Ví dụ: Một tập hợp n biến quan sát độc lập (n người khác nhau), ta có thể rút gọn thành k các nhóm (người độc lập) theo độ tuổi, theo giới tính, theo màu tóc,…

Với một nhóm k như trên ta gọi là một nhân tố độc lập. Một nhân tố độc lập có thể gồm nhiều các biến quan sát độc lập có cùng tương quan.

Các nhân tố độc lập có thể tác động đến cùng một nhân tố xác định (gọi là nhân tố mục tiêu hay còn gọi là biến phụ thuộc).

Mục tiêu của SPSS là đo lường, đánh giá mức độ tác động của các biến quan sát độc lập thuộc một nhân tố độc lập nào đó đến nhân tố mục tiêu (nhân tố phụ thuộc).

Các nhân tố trong mô hình khám phá EFA thường gọi là các biến quan sát và chia thành hai nhóm: Biến độc lập và biến phụ thuộc. Các biến độc lập thể hiện vai trò độc lập trong tác động của chúng đến đối tượng nghiên cứu. Các biến phụ thuộc thể hiện tính phụ thuộc của  chúng dưới tác động của các biến độc lập. Mối quan hệ tuyến tính giữa các biến độc lập và biến phụ thuộc được gọi là có ý nghĩa thống kê nếu thỏa mãn các kiểm định (test) của SPSS.

Trong quá thực hiện các kiểm định, những nhân tố không thỏa mãn (không có tác động ý nghĩa đến nhân tố mục tiêu) sẽ bị loại bỏ khỏi mô hình quan sát và giữ lại các nhân tố có tác động mang ý nghĩa thống kê phục vụ cho đánh giá và ra quyết định cuối cùng của người quản lý.

Do vậy điều kiện kiểm định EFA được thoả mãn thì mức độ giải thích của các số liệu thống kê là đủ độ tin cậy và mức độ phù hợp mang tính khả thi. Nghĩa là, mức độ tác động của các nhân tố độc lập đến các biến phụ thuộc là đủ độ tin cậy và phù hợp với mô hình nghiên cứu.

2.1.2. Kiểm định và xử lý dữ liệu thống kê bằng SPSS theo mô hình hồi quy tuyến tính đa biến MRA

Mô hình hồi quy tuyến tính đa biến (Multiple Regression Anallysis, MRA) là mô hình cơ bản nhất trong các mô hình kinh tế lượng ứng dụng vào các phân tích thống kê mang tính định lượng.

Ta giả thiết rằng hàm f ,

với  phụ thuộc tuyến tính vào bộ các biến độc lập: X1; …;Xp.  các hệ số: α0; α1;…,αi, sai số: β.

Phân tích hồi qui cho phép lựa chọn một đường cong mà vừa khớp nhất với một tập điểm dữ liệu đồng thời còn phải trùng khớp với một mô hình với các thành phần ngẫu nhiên và xác định (deterministic and stochastic components). Thành phần xác định được gọi là bộ dự đoán (predictor) và thành phần ngẫu nhiên được gọi là phần sai số (error term).

Hồi quy tuyến tính đa biến là một trường hợp rất phổ biến trong thực tế, là một phương pháp thống kê mà giá trị kỳ vọng của biến phụ thuộc được tính toán dựa vào điều kiện ngẫu nhiên của các biến độc lập (phương pháp tính toán).

Sau kiểm định MRA, nếu các điều kiện kiểm định MRA được thỏa mãn, có nghĩa là tồn tại hàm tuyến tính đa biến, trong đó f phụ thuộc tuyến tính với các nhân tố Xi độc lập thông qua các hệ số αi chuẩn hóa với phần dư β cho phép. Từ các hệ số tuyến tính này sẽ cho người nghiên cứu cái nhìn tổng quan bằng định lượng về ý nghĩa hay vai trò của nhân tố độc lập tác động đến nhân tố mục tiêu nghiên cứu, Trên cơ sở đó, người nghiên cứu có thể đưa ra những chiến lược, chiến thuật hay các quyết sách mang tính quyết định cho vấn đề nghiên cứu. Đây chính là mục tiêu cuối cùng của xử lý SPSS và không thể phủ nhận nó chính là linh hồn của một đề tài nghiên cứu khoa học.

2.2. Quy trình kiểm định, xử lý dữ liệu thống kê bằng SPSS theo mô hình khám phá EFA và mô hình hồi quy tuyến tính đa biến MRA trong luận văn, luận án đề tài nghiên cứu khoa học và khoa học QLGD

            Nội dung xử lý dữ liệu thống kê bằng SPSS là thành phần không thể thiếu được trong một luận văn, luận án nghiên cứu khoa học đề tài QLGD cũng như các đề tài nghiên cứu khoa học khác. Nó chính là linh hồn của một đề tài nghiên cứu khoa học. Nó cho biết định lượng các tác động có nghĩa của các nhân tố độc lập đến nhân tố mục tiêu và độ tin cậy của các tác động đó.

Trên cơ sở dữ liệu được xử lý phân tích chính xác, khoa học, đủ độ tin cậy giúp cho các nhà nghiên cứu sẽ đưa ra các chiến lược, biên pháp phù hợp để chứng minh, giải quyết vấn đề nghiên cứu.

Để các dữ liệu đảm bảo độ tin cậy tốt nhất cần có quy trình xử lý số liệu thống kê đầu vào. Quy trình được thiết kế chặt chẽ, mang tính khoa học nhằm giảm thiểu sai sót, tiết kiệm thời gian và công sức đem lại hiệu quả tối ưu cho người nghiên cứu.

2.2.1. Quy trình xây dựng mô hình nghiên cứu tác động của các biến quan sát độc lập.

2.2.1.1. Tiêu chuẩn của mô hình tốt.

Tiêu chuẩn 1: Tính đơn giản

Mô hình chứa đủ các biến chủ yếu ảnh hưởng đến biến phụ thuộc để giải thích bản chất của các vấn đề đang nhiên cứu.

Tiêu chuẩn 2: Tính đồng nhất

Với một tập dữ liệu đã cho, các tham số ước lượng phải được duy nhất.

Tiêu chuẩn 3: Đảm bảo độ tin cậy

– Các chỉ số của mô hình phải đảm bảo ý nghĩa thống kê với độ tin cậy cho phép.

Tiêu chuẩn 4: Có khả năng dự báo tốt

– Mô hình có khả năng dự báo tốt là mô hình có ít nhất một chỉ số có ý nghĩa thống kê cho phép dự báo, giải thích về bản chất của vấn đề nghiên cứu.

– Mô hình càng có nhiều chỉ số có ý nghĩa thống kê cho phép dự báo, giải thích về bản chất của vấn đề nghiên cứu thì mô hình đó càng có khả năng dự báo tốt.

– Các biến độc lập càng giải thích được nhiều sự thay đổi của biến phụ thuộc càng tốt.

Tiêu chuẩn 5: Tính thực tiễn

Mô hình cho kết quả dự báo sát thực tế.

2.2.1.2. Quy trình xây dựng mô hình nghiên cứu tác động của các biến quan sát độc lập.

Bước 1: Xác định nhân tố mục tiêu của mô hình nghiên cứu

Căn cứ vào mục tiêu đề tài nghiên cứu,  Người nghiên cứu xác định nhân tố chính (gọi là nhân tố mục tiêu) của đề tài nghiên cứu. Nhân tố này quyết  định cho việc trả lời các câu hỏi mà đề tài nghiên cứu đưa ra.

Ví dụ đề tài nghiên cứu: “QLQT DH THEO TIẾP CẬN ĐẢM BẢO CHẤT LƯỢNG TẠI TRƯỜNG THPT MẠC ĐĨNH CHI-HP” thì câu hỏi: “Nhu cầu QLQT DH THEO TIẾP CẬN ĐẢM BẢO CHẤT LƯỢNG TẠI TRƯỜNG THPT MẠC ĐĨNH CHI-HP” như thế nào? Chính là câu hỏi trọng tâm mà khi nghiên cứu thực trạng cần phải trả lời.

Bước 2: Xây dựng mô hình nghiên cứu

Sau khi xác định được nhân tố mục tiêu nghiên cứu, người nghiên cứu cần  rà soát tất cả các nhân tố độc lập (biến quan sát độc lập) có thể tác động tới nhân tố mục tiêu (biến phụ thuộc). Điều này rất quan trọng, bởi vì nếu bỏ sót bất kỳ một nhân tố nào thì việc đánh giá mô hình tác động rõ ràng là thiếu và yếu, dẫn tới việc ra quyết định sai lầm sau khi nghiên cứu. Trong giai đoạn này cần thực hiện chế độ “ Thừa hơn thiếu”. Bởi vì, trong quá trình chạy SPSS, các nhân tố không thỏa mãn hoặc không có tác động sẽ bị loại bỏ.

Quá trình này trả lời cho câu hỏi:

  1. Áp dụng mô hình nào?
  2. Các yếu tố nào tác động và tác động ra sao đến nhân tố mục tiêu trong mô hình đó?
  3. Công cụ nào để nghiên cứu các tác động của các yếu tố trong mô hình nghiên cứu?

Bước 3: Mô hình hóa nội dung nghiên cứu.

Trên cơ sở của bước 1, 2. Ta tiến hành mô hình hóa các quan hệ tuyến tính giữa các biến quan sát độc lập và biến phụ thuộc. Bước này giúp cho người nghiên cứu và chuyên gia SPSS đồng nhất về quan điểm đánh giá tác động giúp cho quá trình xử lý SPSS được nhanh chóng và đem lại hiệu quả thiết thực.

Trong quá trình này, người nghiên cứu cần xác định rõ đâu là biến quan sát phụ thuộc, đâu là biến quan sát độc lập và mối quan hệ tuyến tính giữa chúng.

Mối quan hệ của các biến quan sát độc lập và phụ thuộc có thể dưới dạng một tầng hoặc nhiều tầng, Ví dụ: biến quan sát B là biến phụ thuộc của nhóm biến quan sát độc lập C, nhưng biến quan sát B lại là biến quan sát độc lập của biến phụ thuộc A.

Tuy nhiên trong thực tiễn nghiên cứu MRA, Mối quan hệ tuyến tính chỉ xét một tầng và Xi là biến đại diện cho nhóm các nhân tố độc lập có cùng tác động và hệ số αi là hệ tuyến tính chung của cả nhóm Xi. điều này cho phép phân tích xoáy sâu vào tác động của từng biến quan sát, từng nhân tố độc lập trong tổng thể tác động của cả mô hình nghiên cứu.               

2.2.2. Quy trình thiết kế thang đo, bảng hỏi và tiến hành khảo sát thu thập dữ liệu.

Bước 1: Thết kế thang đo.

Căn cứ vào mục tiêu, nội dung, mô hình nghiên cứu, tác giả nghiên cứu đưa ra hệ thống các thang đo theo trình tự phù hợp với nội dung và mô hình nghiên cứu. Bước này giúp cho quá trình nhập liệu và xử lý SPSS được thuận lợi, đồng thời quá trình phân tích sau xử lý SPSS dễ dàng hơn.

Tuy nhiên, đa phần các học viên nghiên cứu thường mắc các lỗi đưa ra hệ thống câu hỏi khảo sát trước khi xây dựng thang đo trong mô hình nghiên cứu các yếu tố tác động, dẫn tới:

  • Hoặc không xây dựng được mô hình chuẩn.
  • Hoặc thiếu sót thang đo.

Cả hai trường hợp trên đều phải xây dựng lại mô hình, thang đo, bảng hỏi và thực hiện khảo sát lại, dẫn đến mất nhiều thời gian và công sức. Chính vì lý do này nhiều người do lười hoặc một lý do nào đó không muốn khảo sát lại nên đã lấy số liệu ảo. Điều này là nguy hiểm nhất trong nghiên cứu khoa học vì mọi kết quả sau khảo sát đều là ảo do số liệu đầu vào ảo, không đúng thực tế.

Bước 2: Sau khi xây dựng được thang đo chi tiết, tường minh phù hợp mới mục tiêu, mô hình nghiên cứu người nghiên cứu lựa chọn bậc của thang đo cho mỗi câu hỏi,

Hiện nay, thang đo được sử dụng nhiều nhất là thang đo Likert, số bậc của thang đo likert phụ thuộc tính chất, nội dung của câu hỏi. Nếu là câu hỏi đánh giá thì bậc thang đo thường là 5 hoặc 6 (Không…, ít không.., trung bình, khá.., rất.. tốt) hoặc( Kém, yếu, TB, Khá, Giỏi, Xuất sắc).

Ví dụ: Câu hỏi vấn đề A có quan trọng hay không, ta sử dụng (Không quan trọng, Ít quan trọng, Quan trọng, Khá quan trọng, Rất quan trọng).

Tuy nhiên số bậc của thang đo càng nhiều thì biên độ càng nhỏ, việc đánh giá mức độ tin cậy của tác động càng cao.

Bước 3: Mã hóa thang đo

Mục tiêu của mã hóa thang đo chính là đặt tên rút gọn cho các biến nhằm mục tiêu làm gọn nhẹ mô hình nghiên cứu.

Ví dụ: Tên biến: “Quản lý quá trình dạy học”, ta có thể đặt là: “QLDH”.

Bước 4: Xác định kích thước mẫu(số lượng phiếu hỏi) của nghiên cứu.

Theo Likert, việc xác định kích thước mẫu dựa vào công thức:

Trong đó:        n: là kích thước mẫu

m: số nhóm câu hỏi có thang đánh giá likert như nhau

k: số bậc của thang đo likert

P: câu hỏi thứ j

Ví dụ: Có 2 câu hỏi với thang đo likert bậc 3, 17 câu hỏi với thang likert bậc 2, 9 câu hỏi với thang likert bậc 5. Khi đó kích thước mẫu:

Vậy cần tối thiểu 85 phiếu hỏi.

Bước 5: Xây dựng phiếu khảo sát (bảng hỏi)

Sau bốn bước trên ta tiến hành xây dựng phiếu khảo sát.

Trong phiếu khảo sát, ta cần lưu ý đến các nội dung sau:

Phần I: Tiêu đề và cam kết

+ Tiêu đề khảo sát: “ Phiếu khảo sát…

+ Mục tiêu khảo sát: “Nhằm nghiên cứu thực trạng của ….”

+ Phạm vi khảo sát: “Gồm các cán bộ quản lý, sinh viên,… tại các trường ….”

+ Cam kết của người khảo sát: “Xin cam kết nội dung khảo sát chỉ dùng vào mục tiêu nghiên cứu theo nội dung…(đã nêu) và không sử dụng vào mục đích khác….”

Phần II. Câu hỏi khảo sát

Câu hỏi khảo sát và cách trả lời cho câu hỏi.

Phần III. Các thông tin của các đối tượng khảo sát.

Bước 6: Khảo sát và thu thập dữ liệu khảo sát

+ Khi tiến hành khảo sát, người nghiên cứu cần nhất là có số liệu trung thực chính xác, các nguồn cung cấp thông tin phải đảm bảo. Do vậy người nghiên cứu cần trực tiếp khảo sát hoặc dựa vào các đối tượng tin cậy, tránh hoặc hạn chế tối đa việc nhờ vả, thuê mướn  thu thập dữ liệu.

            + Mã hóa giá trị nhập liệu.

Việc mã hóa giá trị nhập liệu nhằm giúp cho quá trình thực hiện được chuẩn hóa.

Ví dụ: Bảng hỏi của đề tài nghiên cứu A

Câu 1: Bạn đánh giá hiệu quả của đổi mới thi THPT hiện nay? ( Khoanh tròn vào số điểm tương ứng từ 1 tới 5) 1 2 3 4 5

Khi nhập liệu câu hỏi dạng này, giá trị  nhập liệu là 1 đến 5.

Câu 2: Bạn đã từng nghe, hiểu, làm quen với khái niệm “quản lý chất lượng giáo dục” như thế nào?( Đánh dấu √ vào ô vuông trước mỗi câu trả lời)

□ Chưa từng nghe

□ Nghe, chưa làm quen

□ Đã làm quen

Câu hỏi dạng này giá trị nhập liệu được mã hóa: 1 cho đáp án “Chưa từng nghe”, mã hóa 2 cho đáp án “Nghe, chưa làm quen” và 3 cho đáp án “Đã làm quen”.

 Câu 3: Bạn đánh giá chất lượng lĩnh vực quản lý giáo dục như thế nào? ( Khoanh tròn vào số điểm tương ứng từ 1 tới 5)

1 QL Chất lượng đầu ra của học sinh THPT 1 2 3 4 5
2 QL CSVC 1 2 3 4 5
3 QL nguồn lực 1 2 3 4 5

Câu hỏi dạng này giá trị nhập liệu được mã hóa theo điểm đánh giá từ 1 đến 5.

 + Việc nhập liệu sau khảo sát thường nhập bằng bảng Excel, tùy theo tính chất của mô hình nghiên cứu mà có bảng nhập liệu tương ứng. Tuy nhiên để thuận lợi cho người nghiên cứu, người nhập liệu thường theo mô hình bảng hỏi, các công việc còn lại là của công đoạn xử lý SPSS.

Bảng… : Số liệu thống kê đề tài nghiên cứu A

Câu hỏi

Phiếu trả lời

Câu 1 Câu 2 Câu 3.1 Câu 3.2 Câu n
1 1 3 1 2
2 3 1 5 3
n 5 2 4 5

Sau này, chuyên gia SPSS sẽ có kế hoạch mã hóa và nhập liệu cho bạn.

Nếu người nghiên cứu và chuyên gia SPSS đã thống nhất được mã hóa ngay trong mục xây dựng câu hỏi thì việc nhập liệu sẽ theo mã hóa của bảng hỏi.

2.2.3. Quy trình kiểm định, xử lý dữ liệu thống kê bằng SPSS theo mô hình khám phá EFA và mô hình hồi quy tuyến tính đa biến MRA.

Để định lượng các yếu tố tác động đến nhân tố mục tiêu theo mô hình khám phá EFA và mô hình hồi quy tuyến tính đa biến MRA cần tiến hành ba bước sau:

Bước 1: Kiểm định chất lượng của thang đo (nhân tố)

Thang đo trong kiểm định EFA là thang đo likert.

(1)Sử dụng kiểm định Cronbach’s Alpha để đánh giá chất lượng của thanh đo đã xây dựng. Thang đo được đánh giá là chất lượng tốt khi hệ số Cronbach’s Alpha tổng thể lớn hơn hoặc bằng 0.5, nếu với yêu cầu mức độ cao thì lớn hơn 0.6.

(2)Kiểm định hệ số tương quan biển tổng của các biến quan sát Corrected Item-Total Correlation. Thang đo được đánh giá là chất lượng tốt khi hệ số CIT của biến tổng lớn hơn 0.3.

Bước 2: Sử dụng mô hình phân tích khám phá (Exploratory Factor Analysis, EFA) cho các biến độc lập.

(3) Hệ số tải nhân tố Factor loading (FA) phân loại các biến quan sát thành các nhóm có cùng tương quan, hệ số factor của một biến quan sát phải lớn hơn hoặc bằng 0,3.

(4) Kiểm định KMO and Bartlett Test (Kaiser-Meyer-Olkin Measure and Bartlett’s Test).

  • Kiểm định KMO cho phép đánh giá khả năng hội tụ của các dữ liệu trong cùng một nhân tố trong mô hình EFA đối với ứng dụng dữ liệu đầu vào. Thực tế, hệ số KMO phải đảm bảo điều kiện: 0.5≤KMO≤1.
  • Kiểm định Bartlett đánh giá tương quan của các biến trong thước đo đại diện (hay còn gọi là có ý nghĩa thống kê). Các biến quan sát được gọi là có tương quan với nhau trong một nhân tố (thang đo) khi hệ số Sig. (Significance, ) của kiểm định Bartlett nhỏ hơn 0.05.

(5) Kiểm định phương sai trích (% Cumulative Variance, CUV) cho phép đánh giá mức độ giải thích của các biến quan sát đối với tác động có nghĩa trong mô hình quan sát. Trị số phương sai trích cho phép phải lớn hơn 50%. Có nghĩa là hơn 50% thay đổi của nhân tố mục tiêu được giải thích bởi các biến quan sát thành phần (Factor).

Bước 3: Sử dụng mô hình hồi quy tuyến tính đa biến (Multiple Regression Analysis, MRA).

Để định lượng tác động của các quan sát độc lập tới nhân tố mục tiêu ta sử dụng phân tích hồi quy đa biến (Multiple Regression Analysis, MRA). Mô hình MRA được gọi là có ý nghĩa thống kê với độ tin cậy cho phép nếu mô hình thỏa mãn các kiểm định sau:

(6) Kiểm định tương quan từng phần Coefficientsa của các hệ số hồi quy (Significance, Sig.). Mục tiêu của kiểm định này nhằm xem xét biến độc lập tương quan có ý nghĩa với biến phụ thuộc như thế nào (xét riêng từng biến độc lập). Khi hệ số (Sig.≤ 0.05) ta kết luận tương quan của biến độc lập và biến phụ thuộc có độ tin cậy ít nhất 95%. Trong thực tế một số đề tài có cỡ mẫu quan sát nhỏ hơn mức cho phép (bởi một số lý do cụ thể) thì độ tin cậy  trên 80% (Sig.≤ 0.2) cũng có thể chấp nhận được. Tuy nhiên, khi phân tích đánh giá tác động cần hết sức cẩn trọng.

(7) Kiểm định phương sai ANOVA (Analysis of variance, ANOVA). Cho phép kiểm định tính phù hợp của mô hình hồi quy.

Giả thuyết:          H0: Các hệ số hồi quy đều bằng không.

H1: Có ít nhất một hệ số hồi quy khác không.

Nếu ít nhất một hệ số của nhân tố độc lập thỏa mãn Sig.≤ 0.05, tức là mức ý nghĩa đảm bảo độ tin cậy hơn 95%  thì cho phép chấp nhận giả thuyết H1. Mô hình được xem là phù hợp.

(8) Kiểm định đa cộng tuyến ( Muticollinearity, VIF ) cho phép kiểm định hệ số phóng đại phương sai của các biến độc lập . Hệ số phóng đại của phương sai cho phép: VIF<10.

(9) Kiểm định hiện tượng tự tương quan các phần dư (Durbin-Watson, DW) cho phép kiểm định có hay không hiện tượng tự tương quan trong phần dư. Hệ số Durbin-Watson thỏa mãn điều kiện: du< dDW <(4-dL). Các chỉ số du;dL được tra trong bảng Durbin-Watson.

(10) Kiểm định Spearman (Spearman’s rho, RhO) cho phép kiểm định hiện tượng phương sai của các phần dư thay đổi (Heteroskedasticity) nghĩa là giá trị phần dư có phân phối khác nhau. Nếu phương sai của các phần dư thay đổi không thỏa mãn làm cho ước lượng bình phương (R Square, OLS) của các hệ số hồi quy không hiệu quả, các kiểm định giả thiết không còn giá trị. Hiệu quả dự báo không còn chính xác.

Hệ số cho phép của kiểm định Spearman là RhO với chỉ số Sig. (2-Tailed) ≥ 0.05. Nếu hệ số Sig. (2-Tailed) ≥0.05 ta kết luận không có hiện tượng phương sai của các phần dư thay đổi.

Bảng 2 : Các bước thực hiện, các chỉ số cho phép trong phân tích dữ liệu SPSS theo mô hình EFA và mô hình hồi quy đa biến tuyến tính MRA

Bước Tên kiểm định Chỉ số cho phép
I Kiểm định chất lượng của thang đo (nhân tố)  
1 Kiểm định Cronbach’s Alpha CrB ≥0.6
2 Kiểm định Corrected Item-Total Correlation CIT>0.3
II Kiểm định mô hình phân tích khám phá (Exploratory Factor Analysis, EFA) cho các biến độc lập  
3 Hệ số tải nhân tố factor loading FA≥ 0.3
4 Kiểm định KMO and Bartlett Test

(Kaiser-Meyer-Olkin measure and Bartlett’s Test)

0.5≤KMO<1

Sig.<0.05

5 Kiểm định phương sai (% cumulative variance, %CV) CUV≥50%
III Kiểm định mô hình hồi quy tuyến tính đa biến        

(Multiple Regression analysis, MRA)

 
6 Kiểm định tương quan từng phần Coefficientsa của các hệ số hồi quy (Significance, Sig.). Sig.≤ 0.05
7 Kiểm định phương sai ANOVA (Analysis of variance, ANOVA) Sig.≤ 0.05
8 Kiểm định đa cộng tuyến (Muticollinearity,VIF) VIF<10
9 Kiểm định hiện tượng tự tương quan (Durbin-Watson, dDW) du< dDW <(4-dL)
10 Kiểm định hiện tượng phương sai của các phần dư thay đổi (Spearman, RhO) Sig.(2-Tailed) ≥0.05

2.2.4. Đánh giá mô hình và dữ liệu sau kiểm định SPSS.

2.2.4.1. Đánh giá tổng quát mô hình sau kiểm định.

Sau khi đã kiểm định bằng SPSS, với các điều kiện của kiểm định được thỏa mãn. Ta tiến hành phân tích mô hình tác động và ý nghĩa của các nhân tố tác động đến nhân tố mục tiêu nghiên cứu. Ta sử dụng bảng tổng hợp:Coefficientsa

Ví dụ:

Bảng : Số liệu mô hình tổng hợp Coefficientsa

Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. 95% Confidence Interval for B Correlations Collinearity Statistics
B Std. Error Beta Lower Bound Upper Bound Zero-order Partial Part Tolerance VIF
1 (Constant) -1,770E-7 ,090 ,000 1,000 -,180 ,180
A1 ,285 ,090 ,285 3,152 ,003 ,104 ,466 ,285 ,388 ,285 1,000 1,000
A2 ,372 ,090 ,372 4,122 ,000 ,191 ,553 ,372 ,482 ,372 1,000 1,000
A3 ,181 ,090 ,181 2,007 ,050 ,000 ,362 ,181 ,259 ,181 1,000 1,000
A4 ,173 ,090 ,173 1,921 ,060 -,007 ,354 ,173 ,249 ,173 1,000 1,000
A5 ,281 ,090 ,281 3,110 ,003 ,100 ,462 ,281 ,384 ,281 1,000 1,000
A6 -,275 ,090 -,275 -3,048 ,004 -,456 -,094 -,275 -,377 -,275 1,000 1,000
A7 -,188 ,090 -,188 -2,086 ,042 -,369 -,007 -,188 -,269 -,188 1,000 1,000
A8 ,266 ,090 ,266 2,941 ,005 ,085 ,447 ,266 ,366 ,266 1,000 1,000
a. Dependent Variable: NhucauQL

Có hai nội dung chính cần phân tích chi tiết.

+ Căn cứ vào chỉ số Sig. để đưa ra kết luận về mức độ tin cậy của tác động của các nhân tố.

Cụ thể:

  • Nhóm A1, A2, A5, A6, A8 đều có chỉ số Sig.<0.005 nghĩa là mức độ tin cậy của tác động bởi các nhóm nhân tố này vượt 99%.
  • Các nhóm còn lại gồm A3,A4, A7 có chỉ số Sig. <0.06 nên mức độ tin cậy chỉ đạt 94% . Như vậy khi phân tích tác động của nhóm này cần thận trọng, nên căn cứ vào thực tế để xem nhân tố nào trong thực tiễn có khả năng tác động nhiều nhất đến mục tiêu nghiên cứu.

+ Căn cứ vào chỉ số Beta để phân tích mức độ tác động của nhóm nhân tố đó.

Qua bảng trên ta thấy chỉ số Beta có độ lớn khác nhau và có hai loại tác động mang dấu âm và dấu dương.

  • Độ lớn của chỉ số Beta gọi là chỉ số chuẩn hóa của tác động, nó đại diện cho cường độ tác động của nhân tố đó đến nhân tố mục tiêu. Chỉ số càng lớn thì mức độ tác động càng lớn và ngược lại. Chỉ số Beta có thể được quy đổi ra % để tính độ lớn của các chỉ báo khác.
  • Tác động mang dấu dương (+) là tác động thuận chiều, có nghĩa là độ lớn của chỉ số tác động trong nhóm này càng lớn càng thúc đẩy thuận lợi cho nhân tố mục tiêu.
  • Tác động mang dấu âm (-) là tác động ngược chiều so với nhân tố mục tiêu.
  • Trong nghiên cứu khoa học thì tác động âm mang hiệu ứng ngược, tác động xấu đến mục tiêu nghiên cứu. Nguyên nhân do gặp lỗi trong cách đặt vấn đề của câu hỏi và thang đo. Do vậy cần hạn chế tác động của các nhân tố này.

Có hai cách để khắc phục hạn chế của tác động có chỉ số Beta âm:

  1. Khi triển khai các nội dung liên quan nhân tố có chỉ số Beta âm, cần điều chỉnh ngay các nội dung đó trong chương trình hành động.
  2. Điều chỉnh bảng hỏi theo hướng chính xác hóa mục tiêu, bảng hỏi càng gần sát mục tiêu thì kết quả khảo sát thường có chỉ số dương. Cách này rất vất vả và mất thời gian vì phải khảo sát lại, chạy lại SPSS, nhưng cũng chưa chắc đảm bảo các chỉ số Beta đều dương.

Vậy nếu các biến độc lập thỏa mãn điều kiện kiểm định cho phép, ta phân tích và  kết luận mô hình nghiên cứu và dữ liệu thống kê trên cơ sở phù hợp với thực tiễn.

2.2.4.2. Phân tích tác động của các nhân tố độc lập đến nhân tố mục tiêu trên cơ sở dữ liệu của mô hình sau kiểm định.

Sau khi kiểm định bằng SPSS, các dữ liệu của mô hình đã đảm bảo độ tin cậy cho phép. Ta tiến hành phân tích tác động của các nhân tố độc lập đến nhân tố mục tiêu trên cơ sở dữ liệu của mô hình sau kiểm định, gọi tắt là “ Phân tích dữ liệu sau kiểm định”.

Giai đoạn này ta có thể dùng Excel, biểu đồ, sơ đồ để mô tả, phân tích các kết quả sau kiểm định. Những phân tích này quyết định cho người nghiên cứu có tiếp tục thực hiện đề tài nghiên cứu hay không hoặc đưa ra các chiến lược, chiến thuật, các quyết định phù hợp với đặc điểm của đối tượng và mục tiêu nghiên cứu.

Để phân tích ta cần dựa vào ba đối tượng đã thực hiện: Mô hình nghiên cứu, bảng ma trận xoay Rotated Component Matrixa Component và bảng dữ liệu kết quả phân tích mô hình tổng hợp Coefficients.

Ví dụ: Với đề tài nghiên cứu “THỰC TRẠNG QLQT DH THEO TIẾP CẬN ĐẢM BẢO CHẤT LƯỢNG TẠI TRƯỜNG THPT MẠC ĐĨNH CHI-HP” có mô hình nghiên cứu, bảng dữ liệu kết quả phân tích mô hình tổng hợp và bảng ma trận xoay như sau:

Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. 95% Confidence Interval for B Correlations Collinearity Statistics
B Std. Error Beta Lower Bound Upper Bound Zero-order Partial Part Tolerance VIF
1 (Constant) -1,770E-17 ,090 ,000 1,000 -,180 ,180
A1 ,285 ,090 ,285 3,152 ,003 ,104 ,466 ,285 ,388 ,285 1,000 1,000
A2 ,372 ,090 ,372 4,122 ,000 ,191 ,553 ,372 ,482 ,372 1,000 1,000
A3 ,181 ,090 ,181 2,007 ,050 ,000 ,362 ,181 ,259 ,181 1,000 1,000
A4 ,173 ,090 ,173 1,921 ,060 -,007 ,354 ,173 ,249 ,173 1,000 1,000
A5 ,281 ,090 ,281 3,110 ,003 ,100 ,462 ,281 ,384 ,281 1,000 1,000
A6 -,275 ,090 -,275 -3,048 ,004 -,456 -,094 -,275 -,377 -,275 1,000 1,000
A7 -,188 ,090 -,188 -2,086 ,042 -,369 -,007 -,188 -,269 -,188 1,000 1,000
A8 ,266 ,090 ,266 2,941 ,005 ,085 ,447 ,266 ,366 ,266 1,000 1,000
a. Dependent Variable: NhucauQL

 

Rotated Component Matrixa

Component

Reliability Statistics

Cronbach’s Alpha

Nhóm
NT1.1 0,789  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.988 A1
NT1.2 0,803
NT1.3 0,924
NT2.1 0,935
NT2.2 0,859
NT2.3 0,945
NT2.4 0,928
NT2.5 0,896
NT2.6 0,939
TT1.1 0,933
TT1.2 0,938
TT1.3 0,945
TT2.1 0,840
TT2.2 0,836
TT2.3 0,831
TT2.4 0,836
TT2.5 0,762
TT2.6 0,659
VDQTQL1.1 0,646  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0977 A2
VDQTQL1.2 0,703
VDQTQL1.3 0,727
VDQTQL2.1 0,820
VDQTQL2.2 0,821
VDQTQL2.3 0,745
VDQTQL2.4 0,771
VDQTQL2.5 0,890
VDQTQL2.6 0,870
VDQTQL3.1 0,871
VDQTQL3.2 0,840
VDQTQL3.3 0,893
VDQTQL3.4 0,876
VDQTQL3.5 0,924
VDQTQL3.6 0,845
VDQTQL3.7 0,833
VDQTQL3.8 0,750
VDQTQL4.1 0,602
VDQTQL4.2 0,670
VDQTQL4.3 0,827
NT3.1 0,941  

 

 

 

 

 

 

 

 

 

 

0887 A3
NT3.2 0,958
NT3.3 0,958
NT3.4 0,941
NT3.5 0,958
NT3.6 0,921
NT3.7 0,887
NT3.8 0,908
NT4.1 0,846
NT4.2 0,862
NT4.3 0,857
TT3.1 0,885  

 

 

 

 

 

 

 

 

 

 

0980 A4
TT3.2 0,827
TT3.3 0,863
TT3.4 0,876
TT3.5 0,881
TT3.6 0,873
TT3.7 0,871
TT3.8 0,856
TT4.1 0,773
TT4.2 0,760
TT4.3 0,770
QTQL2.1 0,838  

 

 

 

 

 

 

 

 

 

 

0973 A5
QTQL2.2 0,772
QTQL2.3 0,741
QTQL2.4 0,762
QTQL2.5 0,816
QTQL2.6 0,886
QTQL2.7 0,896
QTQL2.8 0,888
QTQL3.1 0,786
QTQL3.2 0,780
QTQL3.3 0,793
NT5.1 0,791  

 

 

 

 

 

 

 

 

 

0974 A6
NT5.2 0,836
NT5.3 0,849
NT6.1 0,903
NT6.2 0,920
NT6.3 0,904
NT6.4 0,916
NT7.1 0,863
NT7.2 0,857
NT7.3 0,845
QTQL1.1 0,903  

 

 

 

 

 

0994 A7
QTQL1.2 0,903
QTQL1.3 0,855
QTQL1.4 0,903
QTQL1.5 0,886
QTQL1.6 0,903
DGHQ1 0,787

0,868

0,893

0,797

0,876

0,904

0,924

0.954 A8
DGHQ2
DGHQ3
DGHQ4
QuanTam1
QuanTam2
QuanTam3
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 11 iterations

Lấy phân tích nhóm A1 làm ví dụ điển hình.

+ Trong bảng ma trận xoay cho ta biết, nhóm nhân tố độc lập A1 gồm các biến quan sát độc lập:

Rotated Component Matrixa

Component

Reliability Statistics

Cronbach’s Alpha

Nhóm
NT1.1 0,789  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.988 A1
NT1.2 0,803
NT1.3 0,924
NT2.1 0,935
NT2.2 0,859
NT2.3 0,945
NT2.4 0,928
NT2.5 0,896
NT2.6 0,939
TT1.1 0,933
TT1.2 0,938
TT1.3 0,945
TT2.1 0,840
TT2.2 0,836
TT2.3 0,831
TT2.4 0,836
TT2.5 0,762
TT2.6 0,659

Trong đó có hai nhóm lớn là NT và TT, theo mô hình nghiên cứu thì đó là nhóm nhận thức về quản lý quá trình dạy học tiếp cận đảm bảo chất lượng và nhóm tồn tại hệ thống đảm bảo chất lượng trong QLQTDH tại trường THPT Mạc đĩnh Chi –HP. Ta có thể phân tích một số tác động điển hình của nhóm này.

+ Hai nhóm này có chỉ số Sig.<0.003 thỏa mãn dữ liệu có độ tin cậy 99%.

+ Hệ số Beta theo bảng Coefficients là (+) 0.285 . Như vậy, hai nhóm này tác động thuận với nhu cầu quản lý. Nghĩa là nếu tăng (1 điểm) mức độ nhận thức và vận dụng quy trình vào công tác quản lý sẽ tăng (0.285 điểm) hiệu quả quản lý quá trình dạy học tiếp cận đảm bảo chất lượng của trường THPT Mạc Đĩnh Chi- Hải Phòng.

+ Để nghiên cứu tỷ lệ tác động của nhóm này ra sao ta quy đổi hệ số chuẩn sang tỷ lệ phần trăm. Theo quy đổi chúng chiếm 14,10% xếp thứ hai sau nhóm A2.

+ Để cụ thể hóa nghiên cứu tác động của một yếu tố trong nhóm NT đó là NT1. Ta dùng biểu đồ Excel để mô tả. Sau đây là ví dụ về mô tả và đánh giá của người nghiên cứu về nhân tố NT1.

Mời các bạn nghiên cứu cụ thể mô hình này trong chương 4.

2.2.5. Quy trình lập bảng hỏi và xử lý số liệu về tính cấp thiết và tính khả thi của đề tài nghiên cứu

  • Tính cấp thiết và tính khả thi của luận văn

Một phần không thể thiếu được của luận văn, luận án đó chính là tính cấp thiết và tính khả thi của đề tài nghiê cứu khoa học.

Tính cấp thiết cho ta biết nhu cầu cấp thiết của đề tài đến đâu. Nếu tính cấp thiết của đề tài không có. Ví như, khi cứu đói thì “ăn uống” là cấp thiết, “mặc” không cấp thiết,… trong giai đoạn cứu đói ta lại nghiên cứu về “ mặc” thì rõ dàng tính cấp thiết của đề tài không có, đề tài sẽ không khả thi.

Trường hợp thứ 2, Nếu tính cấp thiết là có, nhưng đề tài đưa ra những đòi hỏi không thể đáp ứng được, ví dụ: Trường cần đổi mới giáo dục, đề tài lại yêu cầu CSVC hùng mạnh gồm bảng thông minh, máy tính kết nối mạng,… thì trường miền núi vùng sâu vùng xa lấy đâu ra. Vậy tính khả thi của đề tài nghiên cứu không còn.

Ta có thể hiểu, tính cấp thiết là nhu cầu tối thiểu mà đề tài hướng đến, nhưng tính khả thi là xác xuất đề tài có thể áp dụng vào thực tế.

Hai tính chất này liên quan mật thiết với nhau, có ý nghĩa khác nhau tại cùng một địa điểm và cùng mục tiêu phấn đấu.

Khi thực hiện một đề tài nghiên cứu khoa học nhất thiết phải khảo sát hai tính chất này. Nếu không, một đề tài cấp thiết nhưng không khả thi hoặc khả thi nhưng không cấp thiết đều bị bỏ xó. Đó là tính phù hợp thực tiễn của một đề tài nghiên cứu khoa học.

Quy trình lập bảng hỏi giống như mục 2.2.22.2.4 .

Xử lý dữ liệu SPSS về tính cấp thiết và tính khả thi của đề tài nghiên cứu tương tự quá trình trên.


Phần trước: QUY TRÌNH XỬ LÝ SỐ LIỆU THỐNG KÊ BẰNG SPSS TRONG CÁC LUẬN VĂN, LUẬN ÁN QUẢN LÝ GIÁO DỤC, EFA-MÔ HÌNH KHÁM PHÁ VÀ MÔ HÌNH HỒI QUY ĐA BIẾN-MRA (Exploratory Factor Analysis and Multiple Regression Analysis)-P2

Phần sau: QUY TRÌNH XỬ LÝ SỐ LIỆU THỐNG KÊ BẰNG SPSS TRONG CÁC LUẬN VĂN, LUẬN ÁN QUẢN LÝ GIÁO DỤC, EFA-MÔ HÌNH KHÁM PHÁ VÀ MÔ HÌNH HỒI QUY ĐA BIẾN-MRA (Exploratory Factor Analysis and Multiple Regression Analysis)-P4


Trả lời

Translator-Dịch »