W3Cschool
恭喜您成為首批注冊(cè)用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
token 是模型用來(lái)表示自然語(yǔ)言文本的基本單位,也是我們的計(jì)費(fèi)單元,可以直觀的理解為“字”或“詞”;通常 1 個(gè)中文詞語(yǔ)、1 個(gè)英文單詞、1 個(gè)數(shù)字或 1 個(gè)符號(hào)計(jì)為 1 個(gè) token。
一般情況下模型中 token 和字?jǐn)?shù)的換算比例大致如下:
但因?yàn)椴煌P偷姆衷~不同,所以換算比例也存在差異,每一次實(shí)際處理 token 數(shù)量以模型返回為準(zhǔn),您可以從返回結(jié)果的 usage 中查看。
您可以通過(guò)如下壓縮包中的代碼來(lái)運(yùn)行 tokenizer,以離線計(jì)算一段文本的 Token 用量。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: