四分位平均(IQM)(または中位平均)は、四分位範囲の切り捨て平均に基づく中心傾向の統計的尺度です。IQMは、審査員団によって評価されるスポーツにおける採点方法と非常によく似ています。つまり、最低点と最高点を除外し、残りの点の平均値を計算します。
計算
IQM の計算では、第 1 四分位数と第 3 四分位数の間のデータのみが使用され、データの下位 25% と上位 25% は破棄されます。
値が順序付けられていると仮定します。[1]
例
データセットのサイズは4で割り切れる
この方法は例を挙げて説明するのが一番分かりやすいでしょう。次のデータセットを考えてみましょう。
- 5、8、4、38、8、6、9、7、7、3、1、6
まず、リストを最低から最高の順に並べ替えます。
- 1、3、4、5、6、6、7、7、8、8、9、38
データセットには12個の観測値(データポイント)があるため、3つの数値の4つの四分位数が存在します。最小値と最大値の3つの値を破棄します。
1、3、4、5、6、6、7、7、8、8、9、38
12 個の観測値のうち 6 個が残っています。次に、これらの数値の 算術平均を計算します。
- × IQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6.5
これは四分位平均です。
比較のために、元のデータセットの算術平均は
- (5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8.5
外れ値 38 の影響が強いためです。
データセットのサイズが 4 で割り切れない
上記の例では、データセットに12個の観測値が含まれていたため、四分位数の決定は非常に簡単でした。もちろん、すべてのデータセットの観測値が4で割り切れる数であるとは限りません。これを考慮して、IQMの計算方法を調整することができます。したがって、理想的には、対称分布の場合、IQMは平均値と等しくなるようにする必要があります。例えば、
- 1、2、3、4、5
平均値はx mean = 3 であり、対称分布であるため、x IQM = 3 が望ましいことになります。
これは、四分位数と四分位数間データセットの 加重平均を使用して解決できます。
次の 9 つの観測データ セットを考えてみましょう。
- 1、3、5、7、9、11、13、15、17
各四分位には9/4 = 2.25 個の観測値があり、四分位範囲には4.5 個の観測値があります。四分位小数点以下の数値を切り捨て、この数値を第1四分位と第4四分位から削除します(各四分位には2.25 個の観測値があり、したがって下位2つと上位2つが削除されます)。
1、3、(5)、7、9、11、(13)、15、17
したがって、四分位範囲には、重み1の 完全観測値が3つあり、重み0.75の分数観測値が2つあります(1-0.25 = 0.75)。したがって、四分位範囲には合計4.5個の観測値があります(3×1 + 2×0.75 = 4.5個)。
IQM は次のように計算されます。
- × IQM = {(7 + 9 + 11) + 0.75 × (5 + 13)} / 4.5 = 9
上記の例では、平均値は x平均= 9 です。これは予想通り、IQM と同じです。任意の数の観測値に対する IQM の計算方法も同様で、IQM への寄与分は 0、0.25、0.50、または 0.75 のいずれかになります。
平均値と中央値との比較
四分位平均は平均値と中央値の両方のいくつかの特性を共有しています。
- 中央値と同様に、IQMは外れ値の影響を受けにくい。例えば、最大値(38)はデータセットの明らかな外れ値であるが、IQMの計算には使用されない。一方、共通平均(算術平均)はこれらの外れ値の影響を受けやすい:x平均= 8.5。
- 平均値と同様に、IQMはデータセットからの多数の観測値に基づく明確なパラメータです。中央値は常にデータセット内の観測値のいずれかに等しくなります(観測値が奇数の場合)。平均値は、他のすべての観測値の値に応じて、最低観測値と最高観測値の間の任意の値に等しくなります。IQMは、四分位範囲内のすべての観測値に応じて、第1四分位と第3四分位の間の任意の値に等しくなります。
参照
関連統計
アプリケーション
- ロンドン銀行間取引金利(SOFR)は、複数の銀行が提供する金利の四分位平均として参照金利を推定します。(米国における LIBOR の主な代替金利であるSOFR は、堅牢ではない出来高加重平均価格を使用します。)
- Everything2は、ユーザーの投稿の評判の四分位平均を使用して、ユーザーの投稿の質を判断します。[1]
参考文献
- ^ サルキンド、ニール (2010). 研究デザイン百科事典. doi :10.4135/9781412961288. ISBN 978-1-4129-6127-1。