TensorFlow函數教程:tf.nn.ctc_greedy_decoder

2019-01-31 13:45 更新

tf.nn.ctc_greedy_decoder函數

tf.nn.ctc_greedy_decoder(
    inputs,
    sequence_length,
    merge_repeated=True
)

定義在:tensorflow/python/ops/ctc_ops.py.

參見指南:神經網絡>連接時間分類(CTC)

對輸入中給出的logit上執(zhí)行greedy解碼.(最佳方法)

注意:無論merge_repeated的值如何,如果給定時間和批處理的最大索引對應于空白索引(num_classes - 1),則不會發(fā)出新元素.

如果merge_repeatedTrue,則在輸出中合并重復的類.這意味著如果連續(xù)logits的最大索引相同,則只發(fā)出第一個.序列A B B * B * B(其中'*'是空白標簽)將會是:

  • A B B B,如果merge_repeated=True.
  • A B B B B,如果merge_repeated=False.

參數:

  • inputs:3-Dfloat Tensor,大小為[max_time, batch_size, num_classes],是logits.
  • sequence_length:1-Dint32向量,包含序列長度,具有大小[batch_size].
  • merge_repeatedBoolean,默認值:True.

返回:

元組(decoded, log_probabilities),其中已解碼:單個元素列表,decoded[0] 是一個包含解碼輸出的SparseTensor:

decoded.indices: Indices matrix (total_decoded_outputs, 2),行存儲:[batch, time].

decoded.values: Values vector, size (total_decoded_outputs),向量存儲波束 j 的解碼類.

decoded.dense_shape: Shape vector, size (2),形狀值為[batch_size, max_decoded_length] 

neg_sum_logits:對于找到的序列,一個浮點矩陣(batch_size x 1)包含每個時間框架中最大 logit 之和的負數
以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號