如何構(gòu)建一個(gè)識(shí)別英語(yǔ)的程序

2020-08-19 10:47 更新

現(xiàn)在我們不討論你如何學(xué)英語(yǔ),而是讓你構(gòu)建一個(gè)可以識(shí)別、交流英語(yǔ)的程序,你會(huì)如何設(shè)計(jì)?

簡(jiǎn)單的需求分析

以中文為例,當(dāng)你聽(tīng)到一個(gè)女人對(duì)一個(gè)男人說(shuō):“你是一個(gè)男人嗎?”時(shí),你會(huì)收集到哪些信息?你需要哪些信息來(lái)明確這個(gè)女人想表達(dá)的確切意思?

首先是聽(tīng)力輸入,你需要確保麥克風(fēng)錄入了音頻,然后拿到的聲波內(nèi)容是 U#@&!&&。之后我們需要將聲波內(nèi)容輸入到一大堆分析器中進(jìn)行分析,并得到比較精準(zhǔn)的意圖。

第一個(gè)可能是性別分析器,通過(guò)一定的規(guī)則識(shí)別出這是一個(gè)男性的聲音還是女性的聲音。因?yàn)檫@句話是男的說(shuō)出來(lái)還是女的說(shuō)出來(lái)表達(dá)的意思是不一樣的。

第二個(gè)就是內(nèi)容識(shí)別器,先是加載粵語(yǔ)匹配引擎和粵語(yǔ)語(yǔ)料庫(kù)發(fā)現(xiàn)聲波無(wú)法匹配解析,那么換成普通話引擎和語(yǔ)料庫(kù)。此時(shí)如果你的語(yǔ)料庫(kù)里有 “你”、“是”、“一個(gè)”、“男人”、“嗎” 這些聲音素材,那么就可以匹配解析出這句話:“你是一個(gè)男人嗎?”。換言之,如果你沒(méi)有粵語(yǔ)語(yǔ)料庫(kù)和解析引擎,即便是給你一段粵語(yǔ)錄音你也聽(tīng)不懂。如果這句話有一個(gè)生僻單詞你語(yǔ)料庫(kù)里沒(méi)有,那么也是無(wú)法識(shí)別出來(lái)。

之后還有更多識(shí)別器,比如年齡、情緒識(shí)別器、重音和疑問(wèn)語(yǔ)氣識(shí)別句等,這些因素共同決定了這句話究竟想要傳達(dá)什么意思。如果是一個(gè)女性的激動(dòng)的感嘆語(yǔ)氣“你是一個(gè)男人嗎!”,那么可以推測(cè)出這個(gè)女的跟男的有一定的關(guān)系,這個(gè)男的做出了一些傷天害理的事情導(dǎo)致這個(gè)女性在質(zhì)問(wèn)。如果是一個(gè)輕聲細(xì)語(yǔ)的疑問(wèn)句“你是一個(gè)男人嗎?”,可能是一名女性想確認(rèn)對(duì)方的性別。當(dāng)然更準(zhǔn)確表達(dá)這個(gè)意圖的句子應(yīng)該是“你是男性嗎?”或者“男的女的?”。

比較基礎(chǔ)的方案設(shè)計(jì)

上面需求分析只是簡(jiǎn)單的介紹了 聲音 -> 聽(tīng)力識(shí)別器 -> 意圖 的過(guò)程,實(shí)際上語(yǔ)言交流是聽(tīng)說(shuō)讀寫(xiě),其中包含兩個(gè)識(shí)別器(聽(tīng)力識(shí)別器和視力識(shí)別器),一個(gè)核心理解器,兩個(gè)表達(dá)器(口語(yǔ)表達(dá)器和書(shū)寫(xiě)表達(dá)器)。通過(guò)對(duì)應(yīng)的實(shí)際場(chǎng)景,我們可以簡(jiǎn)單的梳理出對(duì)應(yīng)需要的功能。

聽(tīng)力識(shí)別器

  • 聽(tīng)力能力
    • 說(shuō)明:要求可以輸入聲音并轉(zhuǎn)換成一種可分析的信號(hào)。
    • 訓(xùn)練:買(mǎi)個(gè)好麥克風(fēng),對(duì)應(yīng)人類(lèi)是保護(hù)好耳朵和聽(tīng)力。
  • 口音識(shí)別器
    • 說(shuō)明:各類(lèi)方言比如粵語(yǔ),各種口音比如東北口音、廣東口音、英式發(fā)音和美式發(fā)音。
  • 語(yǔ)言特性識(shí)別器
    • 說(shuō)明:語(yǔ)言之間會(huì)有不同特性,比如中文沒(méi)有略讀,都是一個(gè)一個(gè)字念出來(lái),而英文會(huì)為了說(shuō)話省勁而略讀或者連讀,比如 “drink it” 并不是單個(gè)蹦的 “準(zhǔn)克一特”,而是類(lèi)似 “準(zhǔn)kei特”。中文的 “喝它” 就是 “喝它”,不會(huì)有類(lèi)似 “赫特” 之類(lèi)的變化。
    • 訓(xùn)練:擴(kuò)充特殊語(yǔ)言引擎的匹配規(guī)則,擴(kuò)充語(yǔ)料庫(kù),當(dāng)聽(tīng)到 “準(zhǔn)kei特” 可以識(shí)別出是 “drink it”。
  • 音量調(diào)節(jié)和雜音處理器
    • 說(shuō)明:可以通過(guò)算法過(guò)濾無(wú)用雜音,并將小音量調(diào)大使其清晰。人類(lèi)天然進(jìn)化出這種能力,無(wú)需特殊訓(xùn)練。
  • 語(yǔ)氣、性別、身份、語(yǔ)速識(shí)別器
    • 說(shuō)明:人類(lèi)天然進(jìn)化出這種能力,無(wú)需特殊訓(xùn)練。
  • 上下文緩存器
    • 說(shuō)明:交流過(guò)程要有上下文內(nèi)容緩存,結(jié)合輸入理解器。

視力識(shí)別器

  • 視力能力
  • 圖形識(shí)別器
    • 說(shuō)明:不同字體、變形(英文大小寫(xiě)、中文繁簡(jiǎn)體等)都可以識(shí)別出來(lái)具體字符,同時(shí)需要識(shí)別標(biāo)點(diǎn)符號(hào)等輸入理解器。
    • 訓(xùn)練:識(shí)別能力、精準(zhǔn)度和速度。比如一眼看出 messagemassage 是不一樣的。
  • 上下文緩存器

理解器

理解器可以說(shuō)是最重要的部分了,也是最難的部分

  • 語(yǔ)料庫(kù)
    • 說(shuō)明:字母、單詞、發(fā)音、多重語(yǔ)境含義、歷史文化背景、不同形態(tài),同義詞反義詞相近詞。
    • 訓(xùn)練:需要長(zhǎng)期積累和擴(kuò)充,需要大量訓(xùn)練。
  • 識(shí)別引擎
    • 說(shuō)明:?jiǎn)卧~拼裝起來(lái)的句型句式、語(yǔ)法、時(shí)態(tài)含義和規(guī)則、標(biāo)點(diǎn)符號(hào)、單復(fù)數(shù)、慣用表達(dá)。
    • 訓(xùn)練:?jiǎn)吸c(diǎn)突破,專(zhuān)項(xiàng)訓(xùn)練,逐步體系化積累。
  • 思考和思維能力
    • 說(shuō)明:針對(duì)意圖結(jié)合之前的記憶以及經(jīng)驗(yàn)得出自己想要表達(dá)的意圖。
    • 訓(xùn)練:結(jié)構(gòu)性表達(dá),思維能力鍛煉,思考和總結(jié)能力。這個(gè)與語(yǔ)言無(wú)關(guān)。
  • 上下文緩存器

口語(yǔ)表達(dá)器

當(dāng)理解器思考運(yùn)算并得到想要表達(dá)的意圖之后,就需要開(kāi)始表達(dá)傳遞出去。

  • 意圖語(yǔ)料組裝器
    • 說(shuō)明:將意圖結(jié)合語(yǔ)料中的單詞、句型句式、慣用表達(dá)進(jìn)行匹配組合,挑選出最符合你意圖的語(yǔ)句。
  • 發(fā)音器
    • 說(shuō)明:根據(jù)組裝出來(lái)的內(nèi)容,結(jié)合特殊的連讀、略讀等語(yǔ)言特性,轉(zhuǎn)換成發(fā)聲信號(hào)。對(duì)應(yīng)人類(lèi)的話是控制舌頭、聲帶和呼吸系統(tǒng)的肌肉使其變成對(duì)應(yīng)形狀,讓氣流通過(guò)聲帶發(fā)出對(duì)應(yīng)聲音。

書(shū)寫(xiě)表達(dá)器

  • 意圖語(yǔ)料組裝器
  • 書(shū)寫(xiě)表達(dá)器
    • 說(shuō)明:將語(yǔ)料組裝結(jié)果以視覺(jué)的方式表達(dá),對(duì)于人類(lèi)是控制手部肌肉書(shū)寫(xiě)出對(duì)應(yīng)形狀。

從上面可以看出,口語(yǔ)聽(tīng)力相對(duì)于閱讀寫(xiě)作更加困難,主要因?yàn)閷?shí)時(shí)性的要求。你必須迅速反饋不經(jīng)過(guò)思考,這要求你要無(wú)意識(shí)的去用英語(yǔ)表達(dá),所以語(yǔ)言學(xué)習(xí)沒(méi)有技巧,只有大量訓(xùn)練。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)