XSTK căn bản

Bài 5: Đo lường vị trí các giá trị trong tập dữ liệu

Các nhà thống kê thường quan tâm đến vị trí tương đối của một giá trị so với các giá trị khác. Các số đo vị trí phổ biến nhất là điểm phần trăm (điểm bách phân), điểm phần tư (điểm tứ phân vị) và điểm số tiêu chuẩn (z-scores)

Điểm phần trăm (Percentiles)

Giả sử các thành phần trong một tập dữ liệu được sắp xếp theo thứ tự từ nhỏ đến lớn. Những giá trị mà chia tập dữ liệu này thành 100 phần bằng nhau được gọi là các điểm phần trăm hay bách phân điểm.

Một thành phần có điểm phần trăm là Pi sẽ có giá trị lớn hơn i phần trăm tổng số thành phần trong tập dữ liệu. Do đó, quan sát ở điểm phần trăm 50 sẽ được ký hiệu là P50 và có giá trị lớn hơn 50% các quan sát trong tập dữ liệu. Quan sát này cũng tương ứng với trung vị của tập dữ liệu.

Điểm phần tư (Quartiles)

Điểm phần tư (hay còn gọi là tứ phân vị) chia một tập dữ liệu đã được sắp xếp (từ nhỏ đến lớn) thành 4 phần bằng nhau. Các giá trị này được gọi tương ứng là điểm phần tư thứ nhất, điểm phần tư thứ hai và điểm phần tư thứ ba.

Chú ý mối quan hệ giữa điểm phần tư và điểm phần trăm. Q1 tương ứng với P25, Q2 tương ứng với P50, Q3 tương ứng với P75, Q2 là trung vị của tập dữ liệu.

Điểm số tiêu chuẩn (z-Scores)

Điểm số tiêu chuẩn (standard score/z-score) chỉ ra một thành phần chênh lệch so với trung bình là bao nhiêu độ lệch tiêu chuẩn. Điểm số tiêu chuẩn được tính bằng công thức sau:

z = \frac{X - \mu}{\sigma}

Trong đó, z là điểm số tiêu chuẩn, X là giá trị của thành phần, \mu là trung bình của tổng thể, và \sigma là độ lệch tiêu chuẩn.

Đây là cách hiểu ý nghĩa z-score.

  • Z-score nhỏ hơn 0 thể hiện một thành phần nhỏ hơn trung bình
  • Z-score lớn hơn 0 thể hiện một thành phần lớn hơn trung bình
  • Z-score bằng 0 thể hiện một thành phần bằng với trung bình
  • Z-score bằng 1 thể hiện thành phần đó lớn hơn trung bình 1 độ lệch chuẩn, 2 tương đương với 2 độ lệch chuẩn
  • Z-score bằng -1 thể hiện thành phần đó nhỏ hơn trung bình 1 độ lệch chuẩn, -2 tương đương với 2 độ lệch chuẩn,…

Leave a Reply