如何構(gòu)建一個識別英語的程序

2020-08-19 10:47 更新

現(xiàn)在我們不討論你如何學(xué)英語,而是讓你構(gòu)建一個可以識別、交流英語的程序,你會如何設(shè)計?

簡單的需求分析

以中文為例,當(dāng)你聽到一個女人對一個男人說:“你是一個男人嗎?”時,你會收集到哪些信息?你需要哪些信息來明確這個女人想表達(dá)的確切意思?

首先是聽力輸入,你需要確保麥克風(fēng)錄入了音頻,然后拿到的聲波內(nèi)容是 U#@&!&&。之后我們需要將聲波內(nèi)容輸入到一大堆分析器中進(jìn)行分析,并得到比較精準(zhǔn)的意圖。

第一個可能是性別分析器,通過一定的規(guī)則識別出這是一個男性的聲音還是女性的聲音。因為這句話是男的說出來還是女的說出來表達(dá)的意思是不一樣的。

第二個就是內(nèi)容識別器,先是加載粵語匹配引擎和粵語語料庫發(fā)現(xiàn)聲波無法匹配解析,那么換成普通話引擎和語料庫。此時如果你的語料庫里有 “你”、“是”、“一個”、“男人”、“嗎” 這些聲音素材,那么就可以匹配解析出這句話:“你是一個男人嗎?”。換言之,如果你沒有粵語語料庫和解析引擎,即便是給你一段粵語錄音你也聽不懂。如果這句話有一個生僻單詞你語料庫里沒有,那么也是無法識別出來。

之后還有更多識別器,比如年齡、情緒識別器、重音和疑問語氣識別句等,這些因素共同決定了這句話究竟想要傳達(dá)什么意思。如果是一個女性的激動的感嘆語氣“你是一個男人嗎!”,那么可以推測出這個女的跟男的有一定的關(guān)系,這個男的做出了一些傷天害理的事情導(dǎo)致這個女性在質(zhì)問。如果是一個輕聲細(xì)語的疑問句“你是一個男人嗎?”,可能是一名女性想確認(rèn)對方的性別。當(dāng)然更準(zhǔn)確表達(dá)這個意圖的句子應(yīng)該是“你是男性嗎?”或者“男的女的?”。

比較基礎(chǔ)的方案設(shè)計

上面需求分析只是簡單的介紹了 聲音 -> 聽力識別器 -> 意圖 的過程,實際上語言交流是聽說讀寫,其中包含兩個識別器(聽力識別器和視力識別器),一個核心理解器,兩個表達(dá)器(口語表達(dá)器和書寫表達(dá)器)。通過對應(yīng)的實際場景,我們可以簡單的梳理出對應(yīng)需要的功能。

聽力識別器

  • 聽力能力
    • 說明:要求可以輸入聲音并轉(zhuǎn)換成一種可分析的信號。
    • 訓(xùn)練:買個好麥克風(fēng),對應(yīng)人類是保護(hù)好耳朵和聽力。
  • 口音識別器
    • 說明:各類方言比如粵語,各種口音比如東北口音、廣東口音、英式發(fā)音和美式發(fā)音。
  • 語言特性識別器
    • 說明:語言之間會有不同特性,比如中文沒有略讀,都是一個一個字念出來,而英文會為了說話省勁而略讀或者連讀,比如 “drink it” 并不是單個蹦的 “準(zhǔn)克一特”,而是類似 “準(zhǔn)kei特”。中文的 “喝它” 就是 “喝它”,不會有類似 “赫特” 之類的變化。
    • 訓(xùn)練:擴(kuò)充特殊語言引擎的匹配規(guī)則,擴(kuò)充語料庫,當(dāng)聽到 “準(zhǔn)kei特” 可以識別出是 “drink it”。
  • 音量調(diào)節(jié)和雜音處理器
    • 說明:可以通過算法過濾無用雜音,并將小音量調(diào)大使其清晰。人類天然進(jìn)化出這種能力,無需特殊訓(xùn)練。
  • 語氣、性別、身份、語速識別器
    • 說明:人類天然進(jìn)化出這種能力,無需特殊訓(xùn)練。
  • 上下文緩存器
    • 說明:交流過程要有上下文內(nèi)容緩存,結(jié)合輸入理解器。

視力識別器

  • 視力能力
  • 圖形識別器
    • 說明:不同字體、變形(英文大小寫、中文繁簡體等)都可以識別出來具體字符,同時需要識別標(biāo)點符號等輸入理解器。
    • 訓(xùn)練:識別能力、精準(zhǔn)度和速度。比如一眼看出 messagemassage 是不一樣的。
  • 上下文緩存器

理解器

理解器可以說是最重要的部分了,也是最難的部分

  • 語料庫
    • 說明:字母、單詞、發(fā)音、多重語境含義、歷史文化背景、不同形態(tài),同義詞反義詞相近詞。
    • 訓(xùn)練:需要長期積累和擴(kuò)充,需要大量訓(xùn)練。
  • 識別引擎
    • 說明:單詞拼裝起來的句型句式、語法、時態(tài)含義和規(guī)則、標(biāo)點符號、單復(fù)數(shù)、慣用表達(dá)。
    • 訓(xùn)練:單點突破,專項訓(xùn)練,逐步體系化積累。
  • 思考和思維能力
    • 說明:針對意圖結(jié)合之前的記憶以及經(jīng)驗得出自己想要表達(dá)的意圖。
    • 訓(xùn)練:結(jié)構(gòu)性表達(dá),思維能力鍛煉,思考和總結(jié)能力。這個與語言無關(guān)。
  • 上下文緩存器

口語表達(dá)器

當(dāng)理解器思考運算并得到想要表達(dá)的意圖之后,就需要開始表達(dá)傳遞出去。

  • 意圖語料組裝器
    • 說明:將意圖結(jié)合語料中的單詞、句型句式、慣用表達(dá)進(jìn)行匹配組合,挑選出最符合你意圖的語句。
  • 發(fā)音器
    • 說明:根據(jù)組裝出來的內(nèi)容,結(jié)合特殊的連讀、略讀等語言特性,轉(zhuǎn)換成發(fā)聲信號。對應(yīng)人類的話是控制舌頭、聲帶和呼吸系統(tǒng)的肌肉使其變成對應(yīng)形狀,讓氣流通過聲帶發(fā)出對應(yīng)聲音。

書寫表達(dá)器

  • 意圖語料組裝器
  • 書寫表達(dá)器
    • 說明:將語料組裝結(jié)果以視覺的方式表達(dá),對于人類是控制手部肌肉書寫出對應(yīng)形狀。

從上面可以看出,口語聽力相對于閱讀寫作更加困難,主要因為實時性的要求。你必須迅速反饋不經(jīng)過思考,這要求你要無意識的去用英語表達(dá),所以語言學(xué)習(xí)沒有技巧,只有大量訓(xùn)練。

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號