Mục đích của phân tích tài liệu thuở đầu là cách xử lý dữ liệu để rất có thể review unique của chính nó trước khi thực hiện ngẫu nhiên phân tích nào không giống. Có tía bước cơ bản vào so sánh tài liệu gồm: i) xử lý tài liệu (data processing), ii) làm sạch dữ liệu (data cleaning), với iii) bộc lộ tài liệu (data description). Xử lý dữ liệu bao gồm câu hỏi mã hóa cùng nhập tài liệu vào tập dữ liệu có định dạng phù hợp cho những bài xích soát sổ những thống kê. Làm sạch sẽ dữ liệu là đánh giá unique cùng kết cấu của tài liệu cùng thay thế ngẫu nhiên không đúng sót làm sao vì quá trình mã hóa và xử lý. Mô tả tài liệu tương quan tới việc tóm tắt với hiển thị các điểm sáng bao gồm của phân pân hận dữ liệu.

Bạn đang xem: Cách xử lý số liệu trong spss

1. Các chú ý của xử lý dữ liệu

Sau khi đã thu thập, những xem xét sơ cỗ đề xuất bao gồm:

Trước hết là vấn đề bình chọn chặt chẽ con số quan tiền tiếp giáp cùng con số những đổi mới trong phxay đo. Xem xét liệu các ‘con số’ được sử dụng cho những biến đổi thống kê lại gồm thay mặt cho những mức đo lường và tính toán danh nghĩa, sản phẩm từ, khoảng chừng hoặc Xác Suất hay không. Cũng cần lưu ý rằng việc đem những số lượng ngơi nghỉ quý hiếm mặt phẳng cơ mà ko xem xét giải pháp tích lũy dữ liệu rất có thể dẫn đến những công dụng rơi lệch. Dường như, vấn đề đánh giá dữ liệu thô thuở đầu này cũng chính là nhằm chăm chú ở quy trình xây đắp, liệu tất cả tài liệu thu thập được gồm quan trọng đến so sánh thống kê tiếp sau hay là không. Nhiều đơn vị nghiên cứu hoàn toàn có thể sẽ tích lũy công bố chưa phải là trọng tâm của mục tiêu khảo sát. Có một lượng nhỏ dại dữ liệu có rất chất lượng hơn là 1 trong lượng Khủng tài liệu ‘ko sạch’, tức là tài liệu không rất đầy đủ hoặc không thể gọi được.Thứ đọng nhì là bắt buộc để mắt tới đúng đắn bí quyết dữ liệu được lưu lại. lấy ví dụ như, phần đa câu hỏi được fan vấn đáp đánh dấu tốt khoanh tròn? Các quý giá số đạt được nhập bởi bên nghiên cứu không? Các quý giá là số nguyên được áp dụng xuyên thấu trong số ngôi trường hợp xuất xắc là các quý giá số thập phân? Đảm bảo bạn có thể phân biệt giữa những giá trị bị thiếu hụt – không tồn tại cực hiếm được mã hóa, quý hiếm nằm ngoại trừ phạm vi – một quý hiếm được mã hóa nhưng lại biết tới là quan trọng, với đối với dữ liệu bảng câu hỏi, câu trả lời “ko biết” với “ko áp dụng”.Thận trọng với vụ việc lúc tài liệu trường đoản cú các mối cung cấp không giống nhau được phối kết hợp thành một tập tài liệu. Cùng một trở nên số rất có thể được giám sát theo vô số phương pháp khác nhau, ví dụ như bằng phương pháp đặt các câu hỏi khá khác nhau hoặc mã hóa cùng với một trong những chữ số thập phân khác biệt.Việc xem xét những thay đổi gồm sứ mệnh gì vào thi công nghiên cứu và phân tích tổng thể và toàn diện là đặc biệt. ví dụ như, liệu một trở nên danh nghĩa đã có được sử dụng nlỗi một nguyên tố phân tầng trong kiến thiết mẫu mã tuyệt liệu một thay đổi thường xuyên sẽ tiến hành chuyển thành một biến đổi phân nhiều loại với được sử dụng nhằm phân tầng. Biến phân tầng xuất xắc nguyên tố phân tầng là 1 trong biến được thực hiện nhằm bóc tách số lượng dân sinh mục tiêu thành một số trong những đội hoặc tầng phần trong kia các thành viên của từng tầng lớp gồm một điểm sáng tầm thường, ví dụ như phân tầng sinch viên ĐH theo triệu chứng vị trí ở, tầng i) Thành thị; và tầng ii) Nông thôn; hoặc phân tầng sinh viên theo triệu chứng tài bao gồm, tầng i) đủ sinch hoạt, và tầng ii) cảm thấy không được bỏ ra trả sinh hoạt. Tương tự, một vươn lên là rất có thể được áp dụng làm cho yếu tố kiểm soát và điều hành trong kiến thiết phân tách, như một hiệp vươn lên là (covariate) hoặc thay đổi chặn (blocking variable) trong xây cất giai quá. Biến nhập vai trò hiệp thay đổi vẫn rất cần phải là một trong những đo tiếp tục cùng biến chuyển ngăn là một trong những biến đổi phân các loại. Trong một số kiến thiết, điều đặc biệt là nên minh bạch giữa những vươn lên là bội nghịch ứng (kết quả) và những trở nên giải thích (độc lập), ví dụ như một thiết kế hồi quy.
Giải ham mê rõ hơn thuật ngữ “hiệp biến”

Chúng ta biết rằng với một biến chuyển X xuất xắc Y, có ba thông số thống kê mô tả: số cỡ mẫu, số trung (mean), với phương không đúng (variance). Nhưng nhằm mô tả quan hệ thân hai phát triển thành X cùng Y, chúng ta đề nghị đến hiệp biến chuyển.

cũng có thể đọc hiệp đổi thay qua hình học lượng giác nlỗi sau. Chúng ta hiểu được cho một tam giác vuông, ví như gọi cạnh huyền là c và nhì cạnh còn sót lại là a với b, Định lí Pythagoras cho thấy thêm bình pmùi hương cạnh huyền bởi tổng bình phương nhì cạnh kia: c2 = a2 + b2

Nhưng cho 1 tam giác thường, thì côn trùng contact giữa c với nhì cạnh a và b phức hợp rộng cùng với côn trùng liên hệ được định lượng bằng hàm cosine của góc C nhỏng sau: c2 = a2 + b2 – 2ab × Cos (C)

Tương trường đoản cú những điều đó, mang đến nhị đổi thay X cùng Y, cùng giả dụ nhì biến chuyển này trọn vẹn độc lập với nhau, bạn cũng có thể tuyên bố rằng pmùi hương không đúng của biến chuyển X + Y bởi phương thơm không nên của X cộng cùng với phương không nên của Y: var(X+Y) = var(X) + var(Y) . trong những số đó, “var” là viết tắt của pmùi hương không nên (tức variance). Crúc ý rằng X+Y là một trở nên mới.

Nếu hai thay đổi X và Y tất cả đối sánh tương quan nhau, thì bí quyết bên trên được sửa chữa thay thế bởi một cách làm khác với hiệp biến: var(X+Y) = var(X) + var(Y) + 2×Cov(X,Y) . trong số ấy, “Cov” là viết tắt của hiệp biến (covariance).

lấy ví dụ, vào so sánh đối sánh Pearson (r), hiệp trở nên so với từng cá thể của xi với yi được cho bởi vì công thức:

*

Nhưng tại đây họ bao gồm n đối tượng người sử dụng, cho nên vì thế cần phải cộng tất cả lại cùng phân chia đến số đối tượng:

*

Công thức trên chính là khái niệm của hiệp biến chuyển. Từ nhị phương pháp bên trên, bạn có thể đúc kết vài ba dấn xét:

Một hiệp thay đổi là số dương có nghĩa là độ lệch từ bỏ số vừa đủ của x tuân thủ theo đúng chiều hướng thuận với y.Một hiệp trở thành là số âm Có nghĩa là độ lệch từ bỏ số mức độ vừa phải của x tuân theo chiều hướng nghịch với y.Nếu hiệp thay đổi là 0, thì hai trở thành x với y độc lập nhau, tức không có đối sánh tương quan gì với nhau.

Tương quan liêu Pearson (r) là lấy tỉ số của nhị chỉ số này:

*

Nếu cực hiếm của r là dương, nhì biến đổi x cùng y thuộc vươn lên là thiên theo một hướng; giả dụ cực hiếm của r là âm, x cùng y tương tác hòn đảo ngược: tức Khi Lúc x tăng thì y sút, và ngược chở lại.

2. Mã hóa dữ liệu

Sau khi xem xét sơ bộ, họ thực hiện mã hóa tài liệu để có thể đối chiếu thống kê lại. Chúng ta buộc phải cân nhắc về sự việc lựa chọn của format đổi thay, cụ thể là format số học tập giỏi kí tự của mỗi biến đổi, với con số của các cột lúc biến chuyển là số thập phân.

Đối cùng với từng biến chuyển, đọc tin sau là bắt buộc:

thể hiện đổi thay đầy đủ;thương hiệu vươn lên là ngắn;format cột cho trở thành (con số của các cột, nếu như yêu cầu, mang đến dấu thập phân);phạm vi biến hóa có thể bao gồm (giá trị bé dại duy nhất với to nhất), chẳng hạn, thật bất hợp lí Khi tất cả điểm thi là 11 trong khi giới hạn thang đo là 10 điểm;các quý hiếm mang đến dữ liệu bị thiếu (thể hiện là vết chnóng (.) cho các cực hiếm số bị thiếu);Gán “nhãn” cho các vươn lên là danh nghĩa. Đối với nam nữ, 0 = Nam, 1 = Nữ; so với nhóm ngành sinch viên, 1 = Kỹ thuật, 2 = Kinh tế, 3 = Ngoại ngữ.

Sau lúc dữ liệu đã có mã hóa, nó sẽ tiến hành nhập vào tệp dữ liệu máy tính xách tay của công tác thống kê chúng ta thực hiện, ví dụ điển hình SPSS.

3. Hướng dẫn nhập tài liệu vào SPSS

lấy một ví dụ 1, chúng ta gồm dữ liệu về giới tính, đội ngành học, khoảng thời gian ôn tập tân oán, điểm thi cuối kì tân oán (thang điểm 100) của 10 sinc viên tham gia điều tra và hy vọng nhtràn vào SPSS. Số liệu tích lũy được biểu hiện trong bảng dưới đây:

STT12345678910
Giới tínhNamNamNữNamNữNữNữNữNamNam
Nhóm ngànhKinc tếCơ khíCơ khíĐiệnCNTTCNTTCơ khíKinch tếĐiệnĐiện
Giờ ôn tập51053858516
Điểm cuối kì Toán70936974886979805578

Giai đoạn 1: Mã hóa dữ liệu

Chúng ta đề xuất mã hóa thương hiệu đổi mới với các chắt lọc mang đến đổi mới trước khi thực hiện làm việc trên SPSS. Không gồm lao lý buộc ràng đến vấn đề mã hóa này, tuy nhiên chúng ta mã hoá sao cho Khi so với dễ nhận ra thương hiệu biến chuyển cũng tương tự những chắt lọc của đổi thay.

Ở ví dụ bên trên, bạn cũng có thể mã hóa như sau:

Bảng 1: Mã hóa biến chuyển với dữ liệu

Tên biếnMã thương hiệu biếnMã lựa chọn
Giới tínhGioitinh0 = Nam, 1 = Nữ
Nhóm ngànhNganh1 = Kinch tế; 2 = Cơ khí; 3 = Điện; 4 = CNTT
Giờ ôn tậpThoigian
Điểm cuối kì ToánDiemToan

Lưu ý rằng các biến hóa giờ ôn tập, điểm cuối kì Tân oán là một trong những quý giá định lượng cụ thể đề xuất chúng ta ko phải mã nhưng mà nhập trực tiếp vào SPSS.

Giai đoạn 2: Nhập tài liệu trong SPSS

– Cách 1: Mở phần mềm SPSS với khai báo biến

Chương thơm trình SPSS sau khi được msinh sống gồm hai khoanh vùng làm việc là Data View và Variable View. Cách 1 knhị báo biến hóa là được tiến hành sống khu vực vực Variable View. Chúng ta tiến hành đánh tên từng biến hóa cũng giống như vào toàn bộ những cột để khai báo mang lại trở nên.

*

Cột Name: Tại cột này họ đặt mã mang lại tên vươn lên là chỉ cần cliông xã vào ô cùng khắc tên. Trong ví dụ này chúng ta có 4 đổi thay (nam nữ, đội ngành, giờ ôn tập, điểm cuối kì Toán). Theo Bảng 1, trên vào SPSS bọn họ gồm 4 đổi mới Gioitinch, Nghen, Thoigian, DiemToan.Cột Type: Dữ liệu của bọn họ có khá nhiều hình trạng như số, văn uống bạn dạng, tiền tệ, mũ… Nếu bọn họ ko khẳng định đúng mực kiểu dáng tài liệu Lúc knhì báo biến chuyển thì sau đây lúc nhập liệu hoặc so sánh sẽ chạm mặt các rắc rối ko xứng đáng có. SPSS được cho phép knhị báo tài liệu giao diện Numeric (giao diện số), Comma (quý giá số với số đông ‘vệt phẩy’ ckém vào hàng ngàn, sản phẩm nghìn…, vệt chnóng dùng mang đến sản phẩm thập phân), Dot (giống hệt như Comma, nhưng mà lốt chia cách nhóm 3 số là vệt ‘.’, và dấy phẩy dùng mang đến hàng thập phân), Scientific Notation (cần sử dụng kí từ bỏ E để hiển thị số nón, ví dụ năm trước = 2.014E3, 0.0005 = 5E-4), Date (năm, tháng, ngày, giờ, phút ít, giây), Dollar (cực hiếm tiền tệ), Custom Currency (cấu hình thiết lập cho chi phí tệ), String (định hình dạng hình ký kết tự không phải số), Restricted Numeric (hệt như Numeric nhưng lại số chữ số hiển thị là bởi nhau).Cột Width: Thiết lập độ rộng trong có mang của biến khẳng định số lượng ký kết từ bỏ được sử dụng nhằm hiển thị quý hiếm.Cột Decimals: Số chữ số thập phân hiển thị sinh sống cực hiếm knhì báo.Cột Label: Giống nlỗi Name Khi tất cả thuộc bình thường mục tiêu dùng để làm trình bày biến. Khác cùng với Name là nó được cho phép mô tả chi tiết thương hiệu biến cùng với ngẫu nhiên kí trường đoản cú như thế nào.Cột Value: Cột Value là khu vực mà chúng ta gán mã đến tất cả các chắt lọc của trở nên. Ví dụ, với biến giới tính thì giá trị 0 gán nhãn Nam, giá trị 1 gán nhãn Nữ.Cột Missing: chỉ định và hướng dẫn một giá trị tương thích để tủ đầy khoản trống tài liệu. lấy ví dụ như, chúng ta tất cả trở nên hỏi về điểm thi cuối kì Tân oán của rất nhiều tín đồ được khảo sát, vì chưng nguyên nhân tế nhị làm sao đó đã lắc đầu trả lời trở nên hỏi này, trở nên này sẽ không tồn tại giá trị. Tuy nhiên, bạn có thể hướng đẫn một cực hiếm nhằm thay thế sửa chữa khoảng trống này, ví dụ điển hình cực hiếm vừa đủ là một trong những sàng lọc phù hợp.Cột Columns: chỗ knhị báo độ rộng của cột trở thành Khi ta nhập liệu, thường thì lựa chọn là 8.Cột Align: dữ liệu được cnạp năng lượng trái, cnạp năng lượng đề xuất hoặc căn giữa của cột.Cột Measure: knhì báo thang đo đo bộc lộ tài liệu cùng với tía các loại chính là Scale (bao gồm cả Interval cùng Ratio tức thang đo khoảng cách với tỉ lệ), Ordinary (thang đo vật dụng bậc), Norminal (thang đo danh nghĩa).

Xem thêm: Cách Phân Biệt Gà Chọi Trống Mái Khi Mới Nở Đơn Giản, Chính Xác

Kết quả khai báo biến chuyển vào ví dụ trên được trình bày trong hình bên dưới đây:

*

– Bước 2: Nhập dữ liệu

Sau Khi triển khai xong bước 1, họ chuyển hẳn sang thao tác nghỉ ngơi quần thể vực Data View nhằm tiến hành nhập liệu. Sau đó, họ triển khai nhập số liệu vào SPSS đến từng đổi thay. Cuối cùng, họ nên nhấp giữ tài liệu liên tiếp để tránh trường hợp đồ vật bị treo hoặc quắp năng lượng điện đột ngột khiến mất tài liệu đã nhập.

Kết trái nhập tài liệu vào ví dụ bên trên được thể hiện vào hình bên dưới đây:

*

Tài liệu tđắm đuối khảo