統(tǒng)計(jì) - 離群功能

2018-12-28 10:08 更新

概率分布函數(shù)中的異常值是大于遠(yuǎn)離下四分位數(shù)或上四分位數(shù)的數(shù)據(jù)的長度的1.5倍的數(shù)。 具體來說,如果數(shù)字小于$ {Q_1 - 1.5 \\ times IQR} $或大于$ {Q_3 + 1.5 \\ times IQR} $,那么它是一個(gè)異常值。

異常值由以下概率函數(shù)定義和給出:

$ {Outlier \\ datas \\ are \\,\\ lt Q_1 - 1.5 \\ times IQR \\(or)\\ \\ gt Q_3 + 1.5 \\ times IQR} $

其中 -

  • $ {Q_1} $ =第一個(gè)四分位數(shù)

  • $ {Q_2} $ =第三個(gè)四分位數(shù)

  • $ {IQR} $ =四分位數(shù)范圍

例子

問題陳述:

考慮一個(gè)表示8個(gè)不同學(xué)生周期性任務(wù)計(jì)數(shù)的數(shù)據(jù)集。 任務(wù)計(jì)數(shù)信息集為11,13,15,3,16,25,12和14.從學(xué)生周期性任務(wù)計(jì)數(shù)中發(fā)現(xiàn)異常值數(shù)據(jù)。

解決方案:

給定數(shù)據(jù)集為:

11 13 15 3 16 25 12 14

按升序排列:

3 11 12 13 14 15 16 25

第一四分位數(shù)值()$ {Q_1} $

$ {Q_1 = \\ frac {(11 + 12)} {2} \\\\ [7pt]
\\ = 11.5} $

第三四分位值()$ {Q_3} $

$ {Q_3 = \\ frac {(15 + 16)} {2} \\\\ [7pt]
\\ = 15.5} $

低離群值范圍(L)

$ {Q_1 - 1.5 \\ times IQR \\\\ [7pt]
\\ = 11.5 - (1.5 \\ times 4)\\\\ [7pt]
\\ = 11.5 - 6 \\\\ [7pt]
\\ = 5.5} $

上方異常值范圍(L)

$ {Q_3 + 1.5 \\ times IQR \\\\ [7pt]
\\ = 15.5 +(1.5 \\ times 4)\\\\ [7pt]
\\ = 15.5 + 6 \\\\ [7pt]
\\ = 21.5} $

在給定信息中,5.5和21.5比給定數(shù)據(jù)集中的其他值更大,即除了3和25以外,因?yàn)?大于5.5,25小于21.5。

這樣,我們使用3和25作為異常值。


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)