統(tǒng)計數(shù)據(jù) - 數(shù)據(jù)模式

2018-12-28 10:08 更新

當(dāng)它們以圖形方式繪制時,數(shù)據(jù)模式是非常有用的。 數(shù)據(jù)模式通常根據(jù)特征,如中心,展布,形狀和其他不尋常的屬性來描述。 其他特殊描述性標(biāo)簽是對稱的,鐘形的,歪斜的等。

中央

圖形地,分布的中心位于分布的中值。 這樣的圖表顯示,幾乎一半的觀察在任一側(cè)。 每列的高度表示觀察的頻率。

Center Data Pattern

傳播

分布的擴(kuò)展是指數(shù)據(jù)的變化。 如果觀測集合覆蓋范圍較寬,則擴(kuò)展較大。 如果觀察值集中在單個值周圍,則擴(kuò)展更小。

Spread Data Pattern

形狀

可以使用以下特性描述分布的形狀。

  • 對稱 - 在對稱分布中,圖形可以在中心處分開,使得每一半都是另一半的鏡像。

    Symmetry
  • 峰數(shù)。 - 具有一個或多個峰的分布。 具有一個清晰峰的分布被稱為單峰,具有兩個清楚峰的分布被稱為雙峰。 在中心處的單個峰對稱分布被稱為鐘形。

    Number of peaks
  • 偏斜 - 某些分布在圖形的一側(cè)可能有多個觀察結(jié)果。 對較低值的觀察值較少的分布被稱為偏斜; 而對較低值的觀察值較少的分布被稱為左偏。

    Skewness
  • 統(tǒng)一 - 當(dāng)觀察集合沒有峰值并且數(shù)據(jù)在分布范圍內(nèi)均勻分布時,則該分布稱為均勻分布。

    Uniform

不尋常的特點

數(shù)據(jù)模式的常見異常特征是缺口和異常值。

  • 間隙 - 間隙指向沒有觀察結(jié)果的分布區(qū)域。 下圖有一個缺口,因為在分布的中間沒有觀察。

    Gaps
  • 異常值 - 分布可以用與其他觀測數(shù)據(jù)集大不相同的極值表征。 這些極端值被稱為異常值。 下圖說明了具有異常值的分布。

    Outliers

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號