網(wǎng)站建設之Web 語義化

2018-08-01 10:17 更新

Web 語義化


單詞語義化表示了它的意義。

事物的語義化意味著事物。

Web 語義化 = Web的意義。


什么是 Web 語義化?

什么是語義化?其實簡單說來就是讓機器可以讀懂內(nèi)容。

  • 甲殼蟲樂隊是一個來自利物浦受歡迎的樂隊。
  • 約翰列儂是披頭士樂隊的成員。
  • "Hey Jude"是由披頭士的代表作。

我們可以很容易理解上面的句子的意義。但這些語句怎么 被計算機理解呢?

語句由語法規(guī)則創(chuàng)建。語言的語法定義了創(chuàng)建語言語句的規(guī)則。但是如何讓語法變?yōu)檎Z義呢?

語義網(wǎng)是讓機器可以理解數(shù)據(jù)。語義網(wǎng)技術(shù),它包括一套描述語言和推理邏輯。它包通過一些格式對本體(Ontology)進行描述。

語義網(wǎng)并不是網(wǎng)頁之間的鏈接。

語義網(wǎng)描述了事物之間的關(guān)聯(lián)((如 A 是 B的一部分,Y 是 Z 的成員)及事物的屬性(如大小,高度,年齡,價格等)。

The Web

語義網(wǎng)的實現(xiàn)是基于XML(可擴展標記語言eXtensible Markup Langauge)語言和資源描述框架(RDF)來完成的。XML是一種用于定義標記語言的工具,其內(nèi)容包括XML聲明、用以定義語言語法的DTD (document type declaration文檔類型定義)、描述標記的詳細說明以及文檔本身。而文檔本身又包含有標記和內(nèi)容。RDF則用以表達網(wǎng)頁的內(nèi)容。



資源描述框架

RDF(Resource Description Framework),即資源描述框架,是W3C推薦的用來描述WWW上的信息資源及其之間關(guān)系的語言規(guī)范。

RDF(S)是語義網(wǎng)的重要組成部分,它使用URI來標識不同的對象(包括資源節(jié)點、屬性類或?qū)傩灾担┎⒖蓪⒉煌腢RI連接起來,清楚表達對象間的關(guān)系。



實現(xiàn)

語義網(wǎng)雖然是一種更加美好的網(wǎng)絡,但實現(xiàn)起來卻是一項復雜而浩大的工程。 目前語義網(wǎng)的體系結(jié)構(gòu)正在建設中,主要需要以下兩方面的支持:

(1) 數(shù)據(jù)網(wǎng)絡的實現(xiàn)

即:通過一套統(tǒng)一的完善的數(shù)據(jù)標準對網(wǎng)絡信息進行更徹底更詳細的標記,使得語義網(wǎng)能夠精準的識別信息,區(qū)分信息的作用和含義 要使語義網(wǎng)搜索更精確徹底,更容易判斷信息的真假,從而達到實用的目標,首先需要制訂標準,該標準允許用戶給網(wǎng)絡內(nèi)容添加元數(shù)據(jù)(即解釋詳盡的標記),并能讓用戶精確地指出他們正在尋找什么;然后,還需要找到一種方法,以確保不同的程序都能分享不同網(wǎng)站的內(nèi)容;最后,要求用戶可以增加其他功能,如添加應用軟件等。

語義網(wǎng)的實現(xiàn)是基于XML(可擴展標記語言eXtensible Markup Langauge)語言和資源描述框架(RDF)來完成的。XML是一種用于定義標記語言的工具,其內(nèi)容包括XML聲明、用以定義語言語法的DTD (document type declaration文檔類型定義)、描述標記的詳細說明以及文檔本身。而文檔本身又包含有標記和內(nèi)容。RDF則用以表達網(wǎng)頁的內(nèi)容。

(2)具有語義分析能力的搜索引擎

如果說數(shù)據(jù)網(wǎng)絡能夠短時間通過億萬的個體實現(xiàn),那么網(wǎng)絡的語義化智能化就要通過人類尖端智慧群體的努力實現(xiàn)。研發(fā)一種具有語義分析能力的信息搜索引擎將成為語義網(wǎng)的最重要一步,這種引擎能夠理解人類的自然語言,并且具有一定的推理和判斷能力。

語義搜索引擎(semantic search engine)和具有語義分析能力的搜索引擎(semantically enabled search engine)是兩碼事。前者不過是語義網(wǎng)絡的利用,一種信息搜索方式,而具有語義分析能力的搜索引擎是一種能夠理解自然語言,通過計算機的推理而進一步提供更符合用戶心理的答案。


前景

語義網(wǎng)的體系結(jié)構(gòu)正在建設中,當前國際范圍內(nèi)對此體系結(jié)構(gòu)的研究還沒有形成一個令人滿意的嚴密的邏輯描述與理論體系,中國學者對該體系結(jié)構(gòu)也只是在國外研究的基礎上做簡要的介紹,還沒有形成系統(tǒng)的闡述。

語義網(wǎng)的實現(xiàn)需要三大關(guān)鍵技術(shù)的支持:XML、RDF和Ontology。

XML(eXtensible Marked Language,即可擴展標記語言)可以讓信息提供者根據(jù)需要,自行定義標記及屬性名,從而使XML文件的結(jié)構(gòu)可以復雜到任意程度。

它具有良好的數(shù)據(jù)存儲格式和可擴展性、高度結(jié)構(gòu)化以及便于網(wǎng)絡傳輸?shù)葍?yōu)點,再加上其特有的NS機制及XML Schema所支持的多種數(shù)據(jù)類型與校驗機制,使其成為語義網(wǎng)的關(guān)鍵技術(shù)之一。

目前關(guān)于語義網(wǎng)關(guān)鍵技術(shù)的討論主要集中在RDF和Ontology身上。

RDF是W3C組織推薦使用的用來描述資源及其之間關(guān)系的語言規(guī)范,具有簡單、易擴展、開放性、易交換和易綜合等特點。

值得注意的是,RDF 只定義了資源的描述方式,卻沒有定義用哪些數(shù)據(jù)描述資源。RDF由三個部分組成:RDF Data Model、RDF Schema和RDF Syntax。

附上:

1.語義網(wǎng)通過擴展現(xiàn)有的互聯(lián)網(wǎng),在信息中加入表示其含義的內(nèi)容,使計算機可以自動與人協(xié)同工作。也就是說,語義網(wǎng)中的各種資源不再只是各種相連的信息,還包括其信息的真正含義,從而提高計算機處理信息的自動化和智能化。當然,計算機并不具有真正的智能,語義網(wǎng)的建立需要研究者們對信息進行有效的表示,制定統(tǒng)一的標準,使計算機可以對信息進行有效的自動處理。

(來源:何斌 張立厚《信息管理原理與方法》 清華大學出版社 2007年7月第二版)

2e5f2342fce47d514dc298da7f3f484f_m

語義網(wǎng)體系結(jié)構(gòu)

  • 第一層:Unicode與URI,是整個體系結(jié)構(gòu)的基礎。
  • 第二層:XML+NS+XMLSchema,負責語法上表示數(shù)據(jù)的內(nèi)容和結(jié)構(gòu),通過使用標準的格式語言將網(wǎng)絡信息的表現(xiàn)形式、數(shù)據(jù)結(jié)構(gòu)和內(nèi)容分離。
  • 第三層:RDF+RDF Schema,它提供語義模型用于描述網(wǎng)上的信息和類型。其中,RDF(Resource Description Framework),即資源描述框架,是W3C推薦的用來描述WWW上的信息資源及其之間關(guān)系的語言規(guī)范。RDF(S)是語義網(wǎng)的重要組成部分,它使用URI來標識不同的對象(包括資源節(jié)點、屬性類或?qū)傩灾担┎⒖蓪⒉煌腢RI連接起來,清楚表達對象間的關(guān)系。
  • 第四層:本體詞匯層,本體是關(guān)于領(lǐng)域知識的概念化、形式化的明確規(guī)范。在語義網(wǎng)體系結(jié)構(gòu)中,本體的作用主要表現(xiàn)在:(1).概念描述,即通過概念描述揭示領(lǐng)域知識;(2).語義揭示,本體具有比RDF更強的表達能力,可以揭示更為豐富的語義關(guān)系;(3).一致性,本體作為領(lǐng)域知識的明確規(guī)范,可以保證語義的一致性,從而徹底解決一詞多義、多詞一義和詞義含糊現(xiàn)象;(4). 推理支持,本體在概念描述上的確定性及其強大的語義揭示能力在數(shù)據(jù)層面有力地保證了推理的有效性。
  • 第五層:邏輯層,負責提供公理和推理原則,為智能服務提供基礎。其中,描述邏輯(DescriptionLogic)是基于對象的知識表示的形式化,它吸取了KL-ONE的主要思想,是一階謂詞邏輯的一個可判定子集。它與一階謂詞邏輯不同的是,描述邏輯系統(tǒng)能提供可判定的推理服務。除了知識表示以外,描述邏輯還用在其它許多領(lǐng)域,它被認為是以對象為中心的表示語言的最為重要的歸一形式。描述邏輯的重要特征是很強的表達能力和可判定性,它能保證推理算法總能停止,并返回正確的結(jié)果。在眾多知識表示的形式化方法中,描述邏輯在十多年來受到人們的特別關(guān)注,主要原因在于:它們有清晰的模型-理論機制;很適合于通過概念分類學來表示應用領(lǐng)域;并提供了很用的推理服務。
  • 第六層證明層和第七層信任層負責提供認證和信任機制。
以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號