Lưu ý rằng kiểu của biến giới tính (sex) được đặt là numeric, không phải là các từ như "nam" hoặc "nữ". Điều này có vẻ lạ, nhưng nó thể hiện một thực tế phổ biến trong thống kê. Các danh mục như nam/nữ hoặc đã kết hôn/độc thân/đã ly hôn thường được biểu diễn bằng số thay vì từ. Ví dụ, nam có thể được mã hóa là 1 và nữ có thể được mã hóa là 2.
Phương pháp biểu diễn danh mục này đôi khi được gọi là "mã hóa giả" (dummy coding), với từ "giả" có thể được sử dụng vì các giá trị không đại diện cho phép đo số. Đây là mã hóa một biến độc lập, chẳng hạn như thành viên nhóm. Sử dụng số cho các danh mục cũng sẽ tiết kiệm một số thời gian nhập dữ liệu quý giá. Chúng ta có thể nhập 1 hoặc 2 thay vì nhập "nam" hoặc "nữ" cho mỗi người.
Trường nhãn giá trị (value labels) có thể hữu ích để định cấu hình các biến giả này.
![Hình ảnh](https://bsgdtphcm.vn/api/upload/20241223y0zvariableView03.jpg)
[Hình ảnh minh họa thiết lập nhãn giá trị trong đó 1 sẽ đại diện cho nam và 2 sẽ đại diện cho nữ]
Nhấp vào nút ba chấm trong trường nhãn giá trị cho một biến sẽ cung cấp các tùy chọn bổ sung. Sơ đồ mã hóa có thể được nhập dưới dạng giá trị và nhãn giá trị. Nhấp vào "add" để nhập sơ đồ.
Dành thời gian để ghi lại nhãn giá trị của chúng ta sẽ hữu ích cho kết quả đầu ra. Các nhãn như "nam" hoặc "nữ" sẽ được bao gồm trong kết quả đầu ra của chúng ta thay vì các mã "1" và "2" ít thông tin hơn. Tài liệu này sẽ rất có giá trị để theo dõi ý nghĩa của các mã nếu chúng ta tham khảo lại phân tích này vào một thời điểm sau đó. Một năm sau, bạn có thể không nhớ các mã 1 và 2 dự định đại diện cho điều gì.
|