scikit-learn 無監(jiān)督降維

2023-02-20 14:38 更新

如果數(shù)據(jù)集的特征數(shù)量很多,則在進(jìn)行有監(jiān)督的步驟之前先通過無監(jiān)督的步驟來減少特征數(shù)可能會(huì)很有用。許多 無監(jiān)督學(xué)習(xí)方法都實(shí)現(xiàn)了一種可用于降低維度的transform方法。下面,我們討論大量使用此模式的兩個(gè)特定示例。

Pipelining

無監(jiān)督的數(shù)據(jù)約簡和有監(jiān)督的估計(jì)器只需一步即可鏈接在一起。請(qǐng)參閱Pipelining:鏈接估算器

6.5.1 PCA:主成分分析

decomposition.PCA尋找可以捕捉原始特征方差的特征組合。請(qǐng)參閱分解組件中的信號(hào)(矩陣分解問題)

示例

6.5.2 隨機(jī)投影

模塊:random_projection提供了幾種用于通過隨機(jī)投影進(jìn)行數(shù)據(jù)縮減的工具。請(qǐng)參閱文檔的相關(guān)部分:隨機(jī)投影

例子

6.5.3 特征聚集

cluster.FeatureAgglomeration應(yīng)用 層次聚類將行為相似的特征分組在一起。

例子

功能縮放

請(qǐng)注意,如果特征具有不同的縮放比例或統(tǒng)計(jì)屬性,則cluster.FeatureAgglomeration可能無法捕獲相關(guān)特征之間的關(guān)系。在這些設(shè)置中使用preprocessing.StandardScaler可能會(huì)有用。


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)