Thống kê mô tả cung cấp cho chúng ta hiểu biết chung về dữ liệu của chúng ta như thế nào. Đây là một điểm khởi đầu tốt.
Chúng ta thường muốn đi xa hơn những tóm tắt mô tả đơn giản về dữ liệu. Chúng ta có thể muốn biết một biến liên quan đến biến khác như thế nào. Một ví dụ kinh điển là mối quan hệ giữa hút thuốc lá và ung thư phổi. Đôi khi mối quan hệ giữa các biến được gọi là liên kết hoặc kết hợp. Một biến có xu hướng xảy ra hoặc không xảy ra cùng với một biến khác.
Loạt lệnh tiếp theo được dành riêng để khám phá các mối quan hệ với biểu đồ phân tán, hệ số tương quan và hồi quy tuyến tính. Các phân tích này thường được sử dụng trong các tình huống nghiên cứu phi thực nghiệm, nơi chúng ta có thể có nhiều hơn một biến được đo lường có sẵn cho mỗi người. Mục tiêu là xem xét các biến như hút thuốc và ung thư phổi có thể liên quan với nhau như thế nào.
|