104年:醫學一(1)

下列那個測量值較不易受到資料極端值的影響?

A平均值
B中位數
C全距
D標準差

詳細解析

本題觀念:

描述統計中,各種集中趨勢(central tendency)與離散程度(dispersion)測量值對資料極端值(outliers)的敏感度。中位數(median)是最不易受極端值影響的集中趨勢量數。

選項分析

(A) 平均值 平均值(mean)對極端值非常敏感。計算公式為所有數值加總除以個數 Xˉ=Xin\bar{X} = \frac{\sum X_i}{n},只要有一個極端大或極端小的值,就會大幅拉高或拉低平均值。舉例:一班 5 人薪資為 30K、32K、33K、35K、200K,平均值會被最後那個極端值嚴重拉高,無法代表多數人的水準。

(B) 中位數 中位數(median)對極端值不敏感(robust),是本題答案。中位數是排序後位於中間位置的數值,不受極端值大小影響。在統計學中,中位數的崩潰點(breakdown point)高達 50%,即必須超過一半的數據成為極端值,才會影響中位數的估計。即使有少數幾個極端值,中位數仍能穩定反映資料的集中趨勢。

(C) 全距 全距(range)= 最大值 - 最小值,是最容易受極端值影響的離散量數。只要資料中有一個極端值,全距就會大幅改變,完全無法反映資料整體的分散情形。

(D) 標準差 標準差(standard deviation, SD)衡量

...(解析預覽)...