擴(kuò)充語料庫的訓(xùn)練方法

2020-08-19 11:14 更新

經(jīng)過上面分析,可以得出英語學(xué)習(xí)最關(guān)鍵的內(nèi)容就是語料庫,其次就是語法(識(shí)別引擎)。

語料庫并不只是詞匯,訓(xùn)練學(xué)習(xí)方法也并非簡(jiǎn)單的背單詞。

如果通過聽力識(shí)別器輸入語料,首先我們要能區(qū)分口音,比如當(dāng)前語料的英式發(fā)音、美式發(fā)音、澳洲發(fā)音、印度發(fā)音是什么樣。之后就是一些連讀、弱讀和重音變化規(guī)則。通過口音、連讀和重音等規(guī)則正確解析得到詞句短語之后,開始進(jìn)入解析器流程。我們需要知道其中每個(gè)單詞的多重含義,將其含義一個(gè)個(gè)的匹配放入上下文語境結(jié)合重音等得到最準(zhǔn)確的含義。這時(shí)還可能遇到一些詞典里沒有的新詞或者老詞新意,比如 “給力”、“呵呵” 或者各種歪曲解釋的 “不可描述” 的成語等,這些都是人們新造或者賦予了新意思的詞,這些詞意詞典并不一定會(huì)收錄但廣泛在一個(gè)圈子里使用和交流,這就涉及到文化、俚語、流行語等。此外還需要用語法進(jìn)行下一步解析,比如時(shí)態(tài)、標(biāo)點(diǎn)、語氣、句型句式等。

經(jīng)過上面流程才可以解析出比較準(zhǔn)確的意思,做出回應(yīng)還要逆向再來一遍

首先你要按照一定邏輯和結(jié)構(gòu)梳理好你想表達(dá)的意圖。這一步其實(shí)跟語言無關(guān),中文閱讀理解能力好的人,英文只要看懂了閱讀理解能力也會(huì)很強(qiáng),有條理的人不只是說話有條理,做事情也會(huì)很有條理和邏輯性。想好表達(dá)之后你就要開始從語料庫抽取最符合你意圖的詞句,并按照合適的語法進(jìn)行組裝,這時(shí)候就可以看出一個(gè)人語料庫大小和水平。比如:表達(dá)我喜歡一個(gè)梳妝臺(tái),只有最基礎(chǔ)語料庫的我只能說出:我喜歡這個(gè)桌子上有鏡子的東西。這時(shí),看到這句話的人可能知道你想表達(dá)喜愛一張桌子和鏡子的東西,但不知道具體是什么。如果語料庫里有更龐大的名詞庫和程度形容詞,就可以說出:這就是我夢(mèng)寐以求的帶有地中海風(fēng)格雕刻、橢圓梳妝鏡的梳妝臺(tái)??吹竭@句話你腦子里應(yīng)該可以出現(xiàn)這個(gè)梳妝臺(tái)大體的樣子吧。之后,你還需要發(fā)音說出來,先從語料庫里抽取對(duì)應(yīng)的詞句聲音,再結(jié)合略讀、弱讀、重讀等規(guī)則控制舌頭、喉嚨肌肉發(fā)出來對(duì)應(yīng)的聲音,至此算是完成一次對(duì)話。

上面只是聽力識(shí)別器,視力識(shí)別器大同小異,無非是識(shí)別各種字體、大小寫、標(biāo)點(diǎn)符號(hào)等,不再贅述。

通過上面分析可以得知,語料庫里的每個(gè)語料通常需要以下信息:

  • 多種口音的聲音,比如:英美澳印等。
  • 不同詞性和時(shí)態(tài)下,不同的發(fā)音和重音位置變化,比如:resume 在名詞下表簡(jiǎn)歷,發(fā)音 /?rez.?.me?/,而動(dòng)詞表繼續(xù)之前暫停的事情,發(fā)音 /r??zu?m/,如果你發(fā)錯(cuò)了聲音,則會(huì)導(dǎo)致對(duì)方解讀錯(cuò)誤。
  • 單詞的多重含義,比如:current 常見意思是形容詞當(dāng)下的,但實(shí)際上還有名詞的 水流、潮流 等意思。曾經(jīng)做閱讀理解看到帶有水流意思的句子一臉懵逼,沒法用 當(dāng)下 的意思來解釋和理解這個(gè)句子。同樣 spring 除了 春天 還有 彈力、泉水 等完全聯(lián)想不到的意思。
  • 同義詞及其對(duì)比、反義詞等,因?yàn)槟愕幕貜?fù)可能需要否決或者加強(qiáng)觀點(diǎn),這些詞可以幫助你更好更精準(zhǔn)的表達(dá)。比如: raiserise 有什么區(qū)別,什么場(chǎng)景下適用?還有 under、beneathunderneathbelow 等,要怎么用。
  • 語料相關(guān)的俚語、文化、衍生詞等。比如:clump 這個(gè)單詞本意是草叢之類的意思,但是你可以搜下 Google 圖片,形容詞 clumped 還算正常但名詞搜出來
  • 完全變成了一種奇怪的生物。因?yàn)檫@個(gè)單詞正好是兩個(gè)熱門美國(guó)人物名字合起來的發(fā)音,所以老美虛構(gòu)了一個(gè)人出來調(diào)侃。因此如果看到 twitter 上有這個(gè)單詞,要多考慮下是不是在調(diào)侃政治人物。
  • 相關(guān)的常見固定搭配和用法。比如:focus onpay attention to 區(qū)別以及介詞的不同。
  • 名詞的單復(fù)數(shù)形態(tài)和動(dòng)詞的各種時(shí)態(tài)變形及其發(fā)音規(guī)則。比如:hair 在不同詞性下既可數(shù)又不可數(shù),反過來說,也可以通過這個(gè)判斷出此處 hair 要表達(dá)的意思。s 結(jié)尾通常有 z、s?z 三個(gè)發(fā)音,ed 結(jié)尾也有 dt 以及 id 等情況。read 更奇葩,過去式和過去分詞都是 read,但是過去式發(fā)音變了,讀作 /red/,換言之,需要通過這個(gè)發(fā)音來識(shí)別這個(gè)行為是過去發(fā)生的還是現(xiàn)在。

除了語料之外的語法,就靠單點(diǎn)專項(xiàng)突破,比如時(shí)態(tài)種類和規(guī)則、詞性和句子組成結(jié)構(gòu)以及時(shí)間和數(shù)字的組合規(guī)則和發(fā)音方法等等,這里不再贅述。

擴(kuò)充語料庫的訓(xùn)練方法實(shí)戰(zhàn)

例如看到一個(gè) clump 單詞想要學(xué)習(xí),可以這樣做:

  1. 第一遍開始認(rèn)識(shí)單詞:
    • 通過 Cambridge Dictionary 查詢單詞意思,可以看到是否可數(shù)、各種釋義和對(duì)應(yīng)的例句、關(guān)聯(lián)詞和對(duì)比等等。Merriam Webster 是美式在線字典,如有精力也可以作為知識(shí)補(bǔ)充,但是例句和界面不如 Cambridge Dictionary 好用。
    • 查看音標(biāo),嘗試發(fā)音(需要先把音標(biāo)練熟,參照下面教程),收聽詞典中給出的英式和美式的真人發(fā)音,看下自己的發(fā)音是否準(zhǔn)確?哪里不對(duì)?是音標(biāo)還是重音?練對(duì)為止。
    • 打開 Forvo 收聽這個(gè)單詞不同人的發(fā)音,可以嘗試跟讀以便錄入自己的音頻語料庫。也強(qiáng)烈推薦使用 YouGlish ,它會(huì)搜索 Youtube 上面包含當(dāng)前單詞的視頻,這樣發(fā)音更貼合日常對(duì)話。
    • 打開 Google Translate 語音輸入,盡量帶上耳機(jī)或者用耳麥嘗試發(fā)音,查看是否能穩(wěn)定識(shí)別出當(dāng)前單詞。如果不能,可以對(duì) Google Translate 播放母語真人發(fā)音音頻查看能否識(shí)別,如果母語音可以識(shí)別,說明 Google 識(shí)別引擎沒有問題而你的發(fā)音有問題,請(qǐng)重復(fù)上面步驟調(diào)整發(fā)音到可以識(shí)別為止。
    • 打開 Google 搜索,輸入當(dāng)前單詞 + vs 即可看到近義詞和易混淆詞匯,搜索查看相關(guān)對(duì)比。
    • 不是特別抽象的單詞,可以打開 Google 圖片搜索進(jìn)行搜索,通過圖像加深記憶。我用圖片搜索 clump 時(shí),才發(fā)現(xiàn)了兩位候選人的合體的意思。再舉一個(gè)例子,baygulf 在詞典里都有海灣的意思,那它們之間有什么區(qū)別嗎?用 Google 圖片搜索一下你就可以發(fā)現(xiàn),gulf 要比 bay 大的多。
    • 將單詞以及有趣的發(fā)現(xiàn)記錄在 Anki 里面,只需要點(diǎn)擊 Add 并添加單詞即可,也可以在下方多加一些注釋,可繁可簡(jiǎn)不需要花太多時(shí)間。將在后面的 QA 部分解釋為什么要用 Anki。
  2. 第二遍在 Anki 里面復(fù)習(xí),看到單詞嘗試發(fā)音識(shí)別,嘗試回憶相關(guān)的意思、用法以及圖像,盡可能的回憶。如果感覺沒問題那么就點(diǎn)擊 Good 或者 Easy,否則就選擇 Again 或者 Hard。如果掌握不好,請(qǐng)重復(fù)第一遍步驟加深記憶。
  3. 第三遍重復(fù)第二步。
  4. N 遍,已經(jīng)基本掌握。

每隔一段時(shí)間應(yīng)該導(dǎo)出一份單詞列表,放在 Danci88 上面進(jìn)行聽寫。這個(gè)工具雖然比較簡(jiǎn)陋,但是非常實(shí)用。通過聽寫可以看出對(duì)這個(gè)單詞的掌握程度,如果你腦子瞬間出現(xiàn)這個(gè)單詞則表示掌握了。

值得注意的是,上面步驟是相對(duì)完整的學(xué)習(xí)步驟,在實(shí)際學(xué)習(xí)過程中針對(duì)不同類別的單詞應(yīng)該可繁可簡(jiǎn)。比如我在 Anki 建立了 7 個(gè)語料庫,分別是:

  • 發(fā)音錯(cuò)題本:第一眼看到單詞發(fā)出的聲音無法識(shí)別或者與實(shí)際發(fā)音不符。這類單詞要注重音標(biāo)、發(fā)音識(shí)別、多語音辨音等,要用 Google 翻譯來識(shí)別測(cè)試。
  • 聽力單詞本:在聽寫或者聽力時(shí),沒有聽出并寫出的詞句。這類單詞要注重發(fā)音和聽寫訓(xùn)練。
  • 常見名詞本:例如國(guó)家、地區(qū)等。這類單詞只需注重發(fā)音和聽力識(shí)別即可,常見單詞注重拼寫以及了解相關(guān)文化歷史,不常見甚至不需要去學(xué)怎么拼寫,畢竟寫的機(jī)會(huì)不多,而且可以輕易搜到。
  • 拼寫錯(cuò)題本:這類單詞認(rèn)識(shí)意思、會(huì)讀,但是拼寫錯(cuò)了。其實(shí)很多常見的單詞,都覺得習(xí)以為常,但真正讓你拼寫的時(shí)候卻拿捏不準(zhǔn)。這類單詞就要注重拼寫和聽寫,以及多在鍵盤上敲打建立肌肉記憶。
  • 新單詞本:這個(gè)就是遇到的比較重要的新單詞,需要按照上面流程進(jìn)行學(xué)習(xí)。這類單詞就是重復(fù)刷記憶。
  • 熟詞生僻意思單詞本:這個(gè)主要記錄一些很熟悉的詞的生僻意思。比如 champion 比較常見的是名詞冠軍,但其實(shí)也有動(dòng)詞捍衛(wèi)的生僻意思。
  • 連讀訓(xùn)練本:這個(gè)是在練習(xí)口語閱讀或者復(fù)述句子時(shí),覺得很繞口的詞句。比如 the very idea of a police force was seen as foreign as that is 這句話。這類語料要注重?cái)嗑洹⒅刈x、聲調(diào)變化和氣息控制,重復(fù)讀到流暢即可。

上面步驟好像很多,而且需要記憶的內(nèi)容量好大,有什么技巧來快速穩(wěn)定的記憶嗎?

記憶單詞、語料庫唯一的銀彈:重復(fù)訓(xùn)練

時(shí)間回到初中,我英語不是很好,路上遇到同行英語老師便問道學(xué)習(xí)英語有什么技巧嗎?老師微笑說:Practice、Practice and Practice,我卻不以為然,這應(yīng)該是我走過的最大的彎路。

高中之后,為了提升記憶力,我做了很多嘗試和訓(xùn)練。比如七田真的《超右腦照相記憶法》以及《魔術(shù)記憶》等,經(jīng)常對(duì)著曼陀羅圖片看、上學(xué)放學(xué)路上眨眼記車牌、瞬間記住一串手機(jī)號(hào)以及按照《魔術(shù)記憶》的聯(lián)想技巧記憶一些東西,希望能練到過目不忘??雌饋硎峭ι衿嫱τ行У?,尤其是《魔術(shù)記憶》里面的“聯(lián)想記憶法”、“定樁記憶法”、“記憶宮殿記憶法”等,隨便一個(gè)人都可以快速記憶一串不相關(guān)的關(guān)鍵詞。

正是如此,這類英語學(xué)習(xí)速記技巧也成了各種網(wǎng)上學(xué)習(xí)平臺(tái)割韭菜的視頻教程,還賣價(jià)不菲。通過幾個(gè)單詞聯(lián)想讓試看的觀眾覺得神奇,從而腦熱買下教程,大部分人買了不看,即使看了練了也沒啥用。

作為過來人回頭來看,這完全是彎路,這些速記方法大多是表演性質(zhì)的,根本沒法固化成自己的能力。請(qǐng)你回憶一下,你為什么認(rèn)識(shí) commit 這個(gè)單詞?是因?yàn)橥ㄟ^什么其他單詞聯(lián)想出來的嗎?是因?yàn)橥ㄟ^某個(gè)圖片關(guān)聯(lián)想起來的嗎?并不是,當(dāng)你用 git 提交時(shí),你幾乎天天都遇到這個(gè)單詞,同事天天交流用這個(gè)單詞,正是一遍遍的在你面前出現(xiàn)、聽到才讓你非常熟練的掌握這個(gè)單詞。如果你不認(rèn)識(shí) commit 這個(gè)單詞,那么說說你是怎么記住你的那么長(zhǎng)的身份證號(hào)碼的?是通過對(duì)數(shù)字圖像化、故事化編排的?還是大量重復(fù)見到和用到?

你越早明白語言學(xué)習(xí)沒有技巧,就會(huì)走越少的彎路、花越少的冤枉錢。——這是我走過 13 年的彎路近期得出的結(jié)論。

通過重復(fù)訓(xùn)練得到的能力還會(huì)更持久,就像你的 QQ 號(hào),即便過了這么多年沒用應(yīng)該還可以熟練的背出來吧。這也是為什么要用 Anki 的原因,具體介紹詳見 QA 章節(jié)。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)