| 统计量 | 公式 | 说明 |
|---|---|---|
| 均值(Mean) | μ = Σx / n | 所有数据的平均值 |
| 中位数(Median) | 排序后中间位置的值 | 不受极端值影响 |
| 众数(Mode) | 出现次数最多的值 | 可能有多个或不存在 |
| 极差(Range) | max - min | 数据分散程度的简单度量 |
| 方差(Variance) | σ² = Σ(x-μ)² / n | 偏差平方的平均,衡量离散程度 |
| 标准差(Std Dev) | σ = √(方差) | 与原始数据单位相同的离散度量 |
第 P 百分位数是将数据从小到大排列后,有 P% 的数据小于或等于该值。常用的有:
| 百分位数 | 别名 | 含义 |
|---|---|---|
| P25 | Q1(下四分位数) | 25% 的数据低于此值 |
| P50 | Q2(中位数) | 50% 的数据低于此值 |
| P75 | Q3(上四分位数) | 75% 的数据低于此值 |
| P75-P25 | IQR(四分位距) | 数据中间50%的跨度,常用于识别异常值 |
对于符合正态分布的数据:
| 范围 | 包含数据比例 |
|---|---|
| 均值 ± 1倍标准差 | 约 68.27% |
| 均值 ± 2倍标准差 | 约 95.45% |
| 均值 ± 3倍标准差 | 约 99.73% |