python 更復(fù)雜的用戶輸入

2021-09-15 14:57 更新

練習(xí)48.更復(fù)雜的用戶輸入

在以前的游戲中,你只是設(shè)置一些簡(jiǎn)單的預(yù)定義字符串作為用戶輸入處理,用戶輸入“run”,程序能正常運(yùn)行,但是你輸入“run fast”,程序就會(huì)運(yùn)行失敗。我們需要一個(gè)設(shè)備,它可以識(shí)別用戶以各種方式輸入的語匯。例如下面的機(jī)種表述都應(yīng)該被支持才對(duì):

  • open door
  • open the door
  • go THROUGH the door
  • punch bear
  • Punch The Bear in the FACE

也就是說,如果用戶的輸入和常用英語很接近也應(yīng)該是可以的,而你的游戲要識(shí)別出它們的意思。為了達(dá)到這個(gè)目的,我們將寫一個(gè)模塊專門做這件事情。這個(gè)模組里邊會(huì)有若干個(gè)類,它們互相配合,接受用戶輸入,并且將用戶輸入轉(zhuǎn)換成你的游戲可以識(shí)別的命令。

英語的簡(jiǎn)單格式是這個(gè)樣子的:

  • 單詞由空格隔開。
  • 句子由單詞組成。
  • 語法控制句子的含義。

以最好的開始方式是先搞定如何得到用戶輸入的詞匯,并判斷出它們是什么。

我們的游戲詞典

我在游戲里創(chuàng)建了下面這些語匯:

  • 表示方向: north, south, east, west, down, up, left, right, back.
  • 動(dòng)詞: go, stop, kill, eat.
  • 修飾詞: the, in, of, from, at, it
  • 名詞: door, bear, princess, cabinet.
  • 數(shù)字: 由 0-9 構(gòu)成的數(shù)字。

說到名詞,我們會(huì)碰到一個(gè)小問題,那就是不一樣的房間會(huì)用到不一樣的一組名詞,不過讓我們先挑一小組出來寫程序,以后再做改進(jìn)。

如何斷句

我們已經(jīng)有了詞匯表,為了分析句子的意思,接下來我們需要找到一個(gè)斷句的方法。我們對(duì)于句子的定義是“空格隔開的單詞”,所以只要這樣就可以了:

stuff = raw_input('> ')
words = stuff.split()

目前做到這樣就可以了,不過這招在相當(dāng)一段時(shí)間內(nèi)都不會(huì)有問題。

詞匯元組

一旦我們知道了如何將句子轉(zhuǎn)化成詞匯列表,剩下的就是逐一檢查這些詞匯,看它們是什么類型。為了達(dá)到這個(gè)目的,我們將用到一個(gè)非常好使的 Python 數(shù)據(jù)結(jié)構(gòu),叫做”元組(tuple)”。元組其實(shí)就是一個(gè)不能修改的列表。創(chuàng)建它的方法和創(chuàng)建列表差不多,成員之間需要用逗號(hào)隔開,不過方括號(hào)要換成圓括號(hào) ()

first_word = ('verb', 'go')
second_word = ('direction', 'north')
third_word = ('direction', 'west')
sentence = [first_word, second_word, third_word]

這樣我們就創(chuàng)建了一個(gè)(TYPE,WORD)組,讓你識(shí)別出單詞,并且對(duì)它執(zhí)行指令。

這只是一個(gè)例子,不過最后做出來的樣子也差不多。你接受用戶輸入,用 split將其分隔成單詞列表,然后分析這些單詞,識(shí)別它們的類型,最后重新組成一個(gè)句子。

掃描輸入

現(xiàn)在你要寫的是詞匯掃描器。這個(gè)掃描器會(huì)將用戶的輸入字符串當(dāng)做參數(shù),然后返回由多個(gè) (TOKEN, WORD) 組成的一個(gè)列表,這個(gè)列表實(shí)現(xiàn)類似句子的功能。如果一個(gè)單詞不在預(yù)定的詞匯表中,那它返回時(shí) WORD 應(yīng)該還在,但 TOKEN 應(yīng)該設(shè)置成一個(gè)專門的錯(cuò)誤標(biāo)記。這個(gè)錯(cuò)誤標(biāo)記將告訴用戶哪里出錯(cuò)了。

有趣的地方來了。我不會(huì)告訴你這些該怎樣做,但我會(huì)寫一個(gè)“單元測(cè)試(unit test)”,而你要把掃描器寫出來,并保證單元測(cè)試能夠正常通過。

異常和數(shù)字

有一件小事情我會(huì)先幫幫你,那就是數(shù)字轉(zhuǎn)換。為了做到這一點(diǎn),我們會(huì)作一點(diǎn)弊,使用“異常(exceptions)”來做?!爱惓!敝傅氖悄氵\(yùn)行某個(gè)函數(shù)時(shí)得到的錯(cuò)誤。你的函數(shù)在碰到錯(cuò)誤時(shí),就會(huì)“拋出(raise)”一個(gè)“異?!保缓竽憔鸵ヌ幚?handle)這個(gè)異常。假如你在Python 里寫了這些東西:

Python 2.7.1 (r271:86832, Jun 16 2011, 16:59:05) 
[GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2335.15.00)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> int("hell")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: invalid literal for int() with base 10: 'hell'

這個(gè)ValueError就是int()函數(shù)拋出的一個(gè)異常。因?yàn)槟憬oint() 的參數(shù)不是一個(gè)數(shù)字。int()函數(shù)其實(shí)也可以返回一個(gè)值來告訴你它碰到了錯(cuò)誤,不過由于它只能返回整數(shù)值,所以很難做到這一點(diǎn)。它不能返回 -1,因?yàn)檫@也是一個(gè)數(shù)字。int()沒有糾結(jié)在它“究竟應(yīng)該返回什么”上面,而是提出了一個(gè)叫做ValueError的異常,然后你只要處理這個(gè)異常就可以了。

處理異常的方法是使用tryexcept這兩個(gè)關(guān)鍵字:

def convert_number(s):
    try:
        return int(s)
    except ValueError:
        return None

你把要試著運(yùn)行的代碼放到try的區(qū)段里,再將出錯(cuò)后要運(yùn)行的代碼放到 except區(qū)段里。在這里,我們要試著調(diào)用int() 去處理某個(gè)可能是數(shù)字的東西,如果中間出了錯(cuò),我們就抓到這個(gè)錯(cuò)誤,然后返回None。

在你寫的掃描器里面,你應(yīng)該使用這個(gè)函數(shù)來測(cè)試某個(gè)東西是不是數(shù)字。做完這個(gè)檢查,你就可以聲明這個(gè)單詞是一個(gè)錯(cuò)誤單詞了。

測(cè)試第一的挑戰(zhàn)

測(cè)試首先是一種編程策略,你先寫一段自動(dòng)化測(cè)試代碼,假裝代碼是在正常運(yùn)行的,然后你再寫出代碼保證測(cè)試代碼能正常運(yùn)行。這種方法用在當(dāng)你不知道代碼是如何運(yùn)行,但又可以想象必須使用它的時(shí)候。比如說,如果你知道你需要在另一個(gè)模塊中使用一個(gè)新類,但是你不太知道如何實(shí)現(xiàn)這個(gè)類,那么先寫出測(cè)試程序。

我將給你一份測(cè)試代碼,你需要寫出代碼,保證測(cè)試代碼能正常工作。為了完成這個(gè)任務(wù),你可以看看下面的流程:

  1. 創(chuàng)建一小部分我給你的測(cè)試代碼
  2. 確保它運(yùn)行失敗,你知道測(cè)試實(shí)際上是確認(rèn)功能的工作原理。
  3. 到你的源代碼文件lexicon.py中,寫出能使測(cè)試代碼通過的代碼
  4. 重復(fù)以上工作直到你實(shí)現(xiàn)測(cè)試中的所有點(diǎn)

當(dāng)你做到3的時(shí)候,和其他編寫代碼的方法相結(jié)合也是很好的方法:

  1. 編寫你需要的函數(shù)或類的基本框架
  2. 添加注釋,解釋說明這個(gè)函數(shù)是如何運(yùn)行的
  3. 按照描述中的注釋寫代碼
  4. 去掉注釋

這種寫代碼的方法被稱作“psuedo code”,用在你不知道該如何實(shí)現(xiàn)某些功能,但是會(huì)用自己的語言來描述這個(gè)功能的時(shí)候。

結(jié)合“test first”和“psuedo code”策略,我們得出一個(gè)編程的簡(jiǎn)易流程:

  1. 寫一些運(yùn)行失敗的測(cè)試用例
  2. 寫出測(cè)試要用的函數(shù)、方法、類的基本結(jié)構(gòu)
  3. 用自己的語言填充這些框架,解釋它們的功能
  4. 用代碼替換注釋,直到測(cè)試代碼運(yùn)行通過
  5. 重復(fù)

在這節(jié)練習(xí)中,你將通過運(yùn)行我給你的測(cè)試程序逆向運(yùn)行lexicon.py來實(shí)踐這個(gè)方法。

 你應(yīng)該測(cè)試的東西

這里是你要用到的測(cè)試文件:

from nose.tools import *
from ex48 import lexicon

def test_directions():
    assert_equal(lexicon.scan("north"), [('direction', 'north')])
    result = lexicon.scan("north south east")
    assert_equal(result, [('direction', 'north'),
                          ('direction', 'south'),
                          ('direction', 'east')])

def test_verbs():
    assert_equal(lexicon.scan("go"), [('verb', 'go')])
    result = lexicon.scan("go kill eat")
    assert_equal(result, [('verb', 'go'),
                          ('verb', 'kill'),
                          ('verb', 'eat')])

def test_stops():
    assert_equal(lexicon.scan("the"), [('stop', 'the')])
    result = lexicon.scan("the in of")
    assert_equal(result, [('stop', 'the'),
                          ('stop', 'in'),
                          ('stop', 'of')])

def test_nouns():
    assert_equal(lexicon.scan("bear"), [('noun', 'bear')])
    result = lexicon.scan("bear princess")
    assert_equal(result, [('noun', 'bear'),
                          ('noun', 'princess')])

def test_numbers():
    assert_equal(lexicon.scan("1234"), [('number', 1234)])
    result = lexicon.scan("3 91234")
    assert_equal(result, [('number', 3),
                          ('number', 91234)])

def test_errors():
    assert_equal(lexicon.scan("ASDFADFASDF"), [('error', 'ASDFADFASDF')])
    result = lexicon.scan("bear IAS princess")
    assert_equal(result, [('noun', 'bear'),
                          ('error', 'IAS'),
                          ('noun', 'princess')])

你需要用項(xiàng)目框架寫出一個(gè)新的項(xiàng)目,就像你在練習(xí)47中做的一樣。然后你需要?jiǎng)?chuàng)建這個(gè)測(cè)試用例以及你會(huì)用到的lexicon.py,看看測(cè)試用例頂部,看看它是如何被導(dǎo)入的。

接下來,按照我給你的提示寫一些測(cè)試用例??纯次沂侨绾巫龅模?/p>

  1. 在測(cè)試用例頂部寫上導(dǎo)入(import),并保證它正常運(yùn)行
  2. 創(chuàng)建第一個(gè)測(cè)試用例test_directions的空版本,并保證它正常運(yùn)行
  3. 寫出測(cè)試用例test_directions的第一行,保證它運(yùn)行失敗
  4. lexicon.py文件,創(chuàng)建一個(gè)空的scan方法
  5. 運(yùn)行測(cè)試用例,至少保證scan方法運(yùn)行,即便測(cè)試用例運(yùn)行失敗
  6. scan寫出偽代碼注釋,用來說明scan如何通過test_directions測(cè)試
  7. 寫出與注釋相匹配的代碼,保證test_directions測(cè)試通過
  8. 回到方法test_directions,寫完剩下的行
  9. 回到lexicon.py中的scan方法,補(bǔ)全代碼直到test_directions測(cè)試通過
  10. 這樣,當(dāng)你的第一個(gè)測(cè)試通過,你移動(dòng)到下一個(gè)測(cè)試重復(fù)以上步驟。

只要你堅(jiān)持在每次執(zhí)行此過程中的一小塊,你可以成功將大問題分解成更小的問題來解決。就像爬山的時(shí)候,你把整段路程分成一小段一小段。

附加題

  1. 改進(jìn)單元測(cè)試,讓它覆蓋到更多的語匯。
  2. 向語匯列表添加更多的語匯,并且更新單元測(cè)試代碼。
  3. 讓你的掃描器能夠識(shí)別任意大小寫的詞匯。更新你的單元測(cè)試。
  4. 找出另外一種轉(zhuǎn)換為數(shù)字的方法。
  5. 我的解決方案用了 37 行代碼,你的是更長(zhǎng)還是更短呢?

常見問題

Q: 為什么我一直有這個(gè)報(bào)錯(cuò)ImportErrors?

導(dǎo)入異常通常有以下幾點(diǎn)原因:1,在你的模塊(modules)目錄下沒有生成__init__.py文件;2,你在錯(cuò)誤的目錄下啟動(dòng)服務(wù);3,你導(dǎo)入的模塊有拼寫錯(cuò)誤;4,你的PYTHONPATH沒有設(shè)置成.。

Q: try-exceptif-else有什么區(qū)別?

try-expect是用來處理模塊拋出的異常,永遠(yuǎn)都不能用if-else代替。

Q: 有沒有辦法能實(shí)現(xiàn)在等待用戶輸入的時(shí)候,游戲也一樣運(yùn)行

我假設(shè)一種情況,你想實(shí)現(xiàn)用戶在反應(yīng)不夠快的情況下會(huì)遭到怪物的攻擊,這是可能的,但是它涉及的模塊和技術(shù)是本書范圍之外的。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)