TensorFlow函數(shù)教程:tf.nn.ctc_greedy_decoder

2019-01-31 13:45 更新

tf.nn.ctc_greedy_decoder函數(shù)

tf.nn.ctc_greedy_decoder(
    inputs,
    sequence_length,
    merge_repeated=True
)

定義在:tensorflow/python/ops/ctc_ops.py.

參見(jiàn)指南:神經(jīng)網(wǎng)絡(luò)>連接時(shí)間分類(lèi)(CTC)

對(duì)輸入中給出的logit上執(zhí)行g(shù)reedy解碼.(最佳方法)

注意:無(wú)論merge_repeated的值如何,如果給定時(shí)間和批處理的最大索引對(duì)應(yīng)于空白索引(num_classes - 1),則不會(huì)發(fā)出新元素.

如果merge_repeatedTrue,則在輸出中合并重復(fù)的類(lèi).這意味著如果連續(xù)logits的最大索引相同,則只發(fā)出第一個(gè).序列A B B * B * B(其中'*'是空白標(biāo)簽)將會(huì)是:

  • A B B B,如果merge_repeated=True.
  • A B B B B,如果merge_repeated=False.

參數(shù):

  • inputs:3-Dfloat Tensor,大小為[max_time, batch_size, num_classes],是logits.
  • sequence_length:1-Dint32向量,包含序列長(zhǎng)度,具有大小[batch_size].
  • merge_repeatedBoolean,默認(rèn)值:True.

返回:

元組(decoded, log_probabilities),其中已解碼:?jiǎn)蝹€(gè)元素列表,decoded[0] 是一個(gè)包含解碼輸出的SparseTensor:

decoded.indices: Indices matrix (total_decoded_outputs, 2),行存儲(chǔ):[batch, time].

decoded.values: Values vector, size (total_decoded_outputs),向量存儲(chǔ)波束 j 的解碼類(lèi).

decoded.dense_shape: Shape vector, size (2),形狀值為[batch_size, max_decoded_length] 

neg_sum_logits:對(duì)于找到的序列,一個(gè)浮點(diǎn)矩陣(batch_size x 1)包含每個(gè)時(shí)間框架中最大 logit 之和的負(fù)數(shù)
以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)