SAS頻率分布

2018-12-15 16:17 更新

頻率分布是示出數(shù)據(jù)集中的數(shù)據(jù)點的頻率的表。 表中的每個條目包含特定組或間隔內(nèi)的值的出現(xiàn)頻率或計數(shù),并且以這種方式,表概括了樣本中的值的分布。

SAS提供了一個稱為PROC FREQ的過程來計算數(shù)據(jù)集中數(shù)據(jù)點的頻率分布。

語法

SAS中計算頻率分布的基本語法是:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是使用的參數(shù)的描述:

  • Dataset是數(shù)據(jù)集的名稱。
  • Variables_1是需要計算其頻率分布的數(shù)據(jù)集的變量名稱。
  • Variables_2是對頻率分布結(jié)果進行分類的變量。

單變量頻率分布

我們可以使用PROC FREQ確定單個變量的頻率分布。 在這種情況下,結(jié)果將顯示變量的每個值的頻率。 結(jié)果還顯示百分比分布,累積頻率和累積百分比。

在下面的例子中,我們找到名為CARS1的數(shù)據(jù)集的變量馬力的頻率分布,該數(shù)據(jù)集是從庫SASHELP.CARS創(chuàng)建的。 我們可以看到結(jié)果分為兩類結(jié)果。 一個為汽車的每一個。

PROC SQL;
create table CARS1 as
SELECT make,model,type,invoice,horsepower,length,weight
 FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data=CARS1 ;
tables horsepower; 
by make;
run;

當執(zhí)行上面的代碼中,我們得到以下結(jié)果:

多變量頻率分布

我們可以找到多個變量的頻率分布,將它們分組成所有可能的組合。

在下面的例子中,我們計算按汽車類型分組的汽車制造的頻率分布,以及按每種制造分組的每種類型汽車的頻率分布。

proc FREQ data=CARS1 ;
tables make type; 
run;

當執(zhí)行上面的代碼中,我們得到以下結(jié)果:

頻率分布與重量

使用權(quán)重選項,我們可以計算用變量的權(quán)重偏置的頻率分布。 這里,變量的值被取為觀察值的數(shù)量,而不是值的計數(shù)。

在下面的例子中,我們計算變量make和type的頻率分布,分配給馬力的權(quán)重。

proc FREQ data=CARS1 ;
tables make type; 
weight horsepower;
run;

當執(zhí)行上面的代碼中,我們得到以下結(jié)果:


以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號