TensorFlow函數(shù)教程:tf.nn.ctc_beam_search_decoder

2019-01-31 13:45 更新

tf.nn.ctc_beam_search_decoder函數(shù)

tf.nn.ctc_beam_search_decoder(
    inputs,
    sequence_length,
    beam_width=100,
    top_paths=1,
    merge_repeated=True
)

定義在:tensorflow/python/ops/ctc_ops.py.

參見(jiàn)指南:神經(jīng)網(wǎng)絡(luò)>連接時(shí)間分類(CTC)

對(duì)輸入中給出的logits執(zhí)行波束(beam)搜索解碼.

注意:這ctc_greedy_decoder是帶有top_paths=1和beam_width=1的ctc_beam_search_decoder的特殊情況(但解碼器在這種特殊情況下更快).

如果merge_repeated是True,則合并輸出波束中的重復(fù)類.這意味著如果波束中的連續(xù)條目相同,則僅發(fā)出第一個(gè)條目.也就是說(shuō),當(dāng)頂部路徑為時(shí)A B B B B,返回值為:

  • A B:如果merge_repeated = True.
  • A B B B B:如果merge_repeated = False.

參數(shù):

  • inputs:3-D float類型的 Tensor,大小為[max_time x batch_size x num_classes],是logits.
  • sequence_length:1-D int32向量,包含序列長(zhǎng)度,具有大小[batch_size].
  • beam_width:int標(biāo)量大于等于0(波束搜索波束寬度).
  • top_paths:int標(biāo)量大于等于0,小于等于beam_width(控制輸出大小).
  • merge_repeated:Boolean,默認(rèn)值:True.

返回:

元組(decoded, log_probabilities),其中:top_paths長(zhǎng)度的列表,其中decoded[j]是SparseTensor,它包含已解碼的輸出:

decoded[j].indices: Indices matrix (total_decoded_outputs[j] x 2),行存儲(chǔ):[batch, time].

decoded[j].values: Values vector, size (total_decoded_outputs[j]),向量存儲(chǔ)波束 j 的解碼類.

decoded[j].dense_shape: Shape vector, size (2),形狀值為[batch_size, max_decoded_length[j]]

log_probability:一個(gè)浮點(diǎn)矩陣(batch_size x top_paths),包含序列對(duì)數(shù)概率.

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)