TensorFlow 機器學習和深度學習概念入門

2018-12-13 22:09 更新

作者:譚東

    對于很多初入學習人工智能的學習者來說,對人工智能、機器學習、深度學習的概念和區(qū)別還不是很了解,那么接下來就給大家從概念和特點上進行闡述。先看下三者的關系。

301611254811216

    人工智能包括了機器學習,機器學習包括了深度學習,他們是子類和父類的關系。

    先看什么是人工智能。人工智能(Artificial Intelligence),英文縮寫為AI。是計算機科學的一個分支,二十世紀七十年代以來被稱為世界三大尖端技術之一(空間技術能源技術、人工智能)。也被認為是二十一世紀三大尖端技術(基因工程、納米科學人工智能)之一。1956年夏季,以麥卡賽、明斯基、羅切斯特和申農等為首的一批有遠見卓識的年輕科學家在一起聚會,共同研究和探討用機器模擬智能的一系列有關問題,并首次提出了“人工智能”這一術語,它標志著“人工智能”這門新興學科的正式誕生。人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。數學常被認為是多種學科的基礎科學,數學也進入語言、思維領域,人工智能學科也必須借用數學工具。

    人工智能實際應用:機器視覺,指紋識別,人臉識別視網膜識別,虹膜識別掌紋識別,專家系統(tǒng),自動規(guī)劃,智能搜索,定理證明,博弈,自動程序設計,智能控制,機器人學,語言和圖像理解,遺傳編程等。涉及到哲學和認知科學,數學,神經生理學,心理學,計算機科學,信息論控制論,不定性論等學科。研究范疇包括自然語言處理,知識表現,智能搜索,推理,規(guī)劃,機器學習,知識獲取,組合調度問題,感知問題,模式識別,邏輯程序設計軟計算,不精確和不確定的管理,人工生命,神經網絡,復雜系統(tǒng),遺傳算法等。人工智能目前也分為:強人工智能(BOTTOM-UP AI)和弱人工智能(TOP-DOWN AI),有興趣大家可以自行查看下區(qū)別。

    機器學習(Machine Learning, ML),是人工智能的核心,屬于人工智能的一個分支,是一個大的領域,是讓計算機擁有像人一樣的學習能力,模擬和實現人的學習行為和能力,可以像人一樣具有識別和判斷的能力,可以看作是仿生學。機器學習應用領域十分廣泛,例如:數據挖掘、數據分類、計算機視覺、自然語言處理(NLP)、生物特征識別、搜索引擎、醫(yī)學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰(zhàn)略游戲和機器人運用等。

221213379524716


    李飛飛說,機器是又快又準確,但是人類聰明呀!機器學習其實是在總結數據,預測未知。它具有高速的計算能力,我們可以通過不斷的學習用它來識別各種植物、動物等,并提高準確率。

QQ截圖20170601224946


機器學習的工作方式:

1)選擇數據:將你的數據分成三組:訓練數據、驗證數據和測試數據。

2)模型數據:使用訓練數據來構建使用相關特征的模型。

3)驗證模型:使用你的驗證數據接入你的模型。

4)測試模型:使用你的測試數據檢查被驗證的模型的表現。

5)使用模型:使用完全訓練好的模型在新數據上做預測。

6)調優(yōu)模型:使用更多數據、不同的特征或調整過的參數來提升算法的性能表現。

機器學習的分類:

基于學習策略的分類

1)機械學習 (Rote learning)

2)示教學習 (Learning from instruction或Learning by being told)

3)演繹學習 (Learning by deduction)

4)類比學習 (Learning by analogy)

5)基于解釋的學習 (Explanation-based learning, EBL)

6)歸納學習 (Learning from induction)

基于所獲取知識的表示形式分類 

1)代數表達式參數

2)決策樹

3)形式文法

4)產生式規(guī)則

5)形式邏輯表達式

6)圖和網絡

7)框架和模式(schema)

8)計算機程序和其它的過程編碼

9)神經網絡

10)多種表示形式的組合

綜合分類

1)經驗性歸納學習 (empirical inductive learning)

2)分析學習(analytic learning)

3)類比學習

4)遺傳算法(genetic algorithm)

5)聯(lián)接學習

6)增強學習(reinforcement learning)

學習形式分類

1)監(jiān)督學習(supervised learning)

2)非監(jiān)督學習(unsupervised learning)

當然,后面的深度學習也有監(jiān)督學習、半監(jiān)督學習和非監(jiān)督學習的區(qū)分。

    接下來看下深度學習。深度學習(Deep Learning是機器學習的一種,是它的一個大的分支,深度學習的概念由Hinton等人于2006年提出,深度學習的概念源于人工神經網絡的研究。既然叫做學習,那么自然與我們人類的學習過程有相似之處,其實就是仿生學,仿照我們人類大腦的思維方式以及神經網絡的接收和反饋方式進行計算機模擬深度學習的。我們的大腦就是一個深度學習的超級計算機。深度學習實際上指的的深度神經網絡學習,普通神經網絡由于訓練代價較高,一般只有3-4層,而深度神經網絡由于采用了特殊的訓練方法加上一些技術算法,可以達到8-10層。深度神經網絡能夠捕捉到數據中的深層聯(lián)系,從而能夠得到更精準的模型,而這些聯(lián)系不容易被普通的機器學習方法所發(fā)覺。

    用官方的含義就是:含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現數據的分布式特征表示。機器學習方法一樣,深度機器學習方法也有監(jiān)督學習與無監(jiān)督學習之分.不同的學習框架下建立的學習模型很是不同.例如,卷積神經網絡(Convolutional neural networks,簡稱CNNs)就是一種深度的監(jiān)督學習下的機器學習模型,而深度置信網(Deep Belief Nets,簡稱DBNs)就是一種無監(jiān)督學習下的機器學習模型。

    深度學習整個過程就是數據收集、數據清洗處理、傳入數據進行訓練模型和學習優(yōu)化、經過不斷優(yōu)化調節(jié)后形成高準確率的識別分類模型,供相應的領域進行傳入相關數據進行應用分類。舉個例子,我們人類在剛出生時看到一個手機,那么他是不知道這個是什么的,并且有各種各樣形狀和樣式的手機,此時我們的深度學習系統(tǒng)初始狀態(tài)就是這樣的。但是經過父母和周圍的分類和指導,我們漸漸的知道了這種樣子和形狀、功能的物體是手機,那么我們通過大量的數據就具有了學習和分辨手機的能力模型,那么這就是我們的深度學習系統(tǒng)在經過數據和算法訓練后所具備的功能和學習能力。就是這么簡單,可以說就是仿生學。

    2017年CCF青年精英大會,香港中文大學教授湯曉鷗指出,深度學習的三大核心要素,就是算法設計、高性能的計算能力、大數據。我覺得應該按照這個順序排序:大數據、算法設計、高性能的計算能力。

    例如深度學習在語音識別和自然語言領域,微軟研究人員通過與hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,并且在大詞匯量語音識別系統(tǒng)中獲得巨大成功,使得語音識別的錯誤率相對減低30%。但是,DNN還沒有有效的并行快速算法,很多研究機構都是在利用大規(guī)模數據語料通過GPU平臺提高DNN聲學模型的訓練效率。在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,并且速度飛快。國內方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。

    最后,給大家附帶一個深度學習部分常用的神經網絡算法的圖形展示。

20170601133254850

參考文獻:

[1]http://openclassroom.stanford.edu/

[2]斯坦福CS231n—深度學習與計算機視覺

[3]http://www.asimovinstitute.org/neural-network-zoo/


qrcode_for_gh_e7ea06bd55f8_430 (1)



以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號