TensorFlow函數(shù):tf.string_split

2018-03-21 13:47 更新

tf.string_split函數(shù)

tf.string_split(
    source,
    delimiter=' ',
    skip_empty=True
)

定義在:tensorflow/python/ops/string_ops.py.

參見(jiàn)指南:字符串操作>拆分

將基于 delimiter 的 source 的元素拆分為 SparseTensor.

設(shè) N 是源的大小(通常 N 將是批量大小).將基于 delimiter 的 source 的元素拆分,并返回一個(gè)包含分割標(biāo)記的 SparseTensor.空標(biāo)記被忽略.

如果 delimiter 是一個(gè)空字符串,則該 source 中的每個(gè)元素被分割成單獨(dú)的字符串,每個(gè)字符串包含一個(gè)字節(jié).這包括拆分 UTF-8 的多字節(jié)序列.如果分隔符包含多個(gè)字節(jié),則將其視為一組分隔符,每個(gè)分隔符都被視為潛在的分割點(diǎn).

例如:N = 2,source [0] 是 'hello world',source [1] 是'ab c',那么輸出將是:

st.indices = [0, 0; 0, 1; 1, 0; 1, 1; 1, 2] st.shape = [2, 3] st.values = ['hello', 'world', 'a', 'b', 'c']

函數(shù)參數(shù):

  • source:1-D 字符串 Tensor,要分割的字符串.
  • delimiter:0-D 字符串 Tensor,分隔符,字符串應(yīng)該是長(zhǎng)度為 0 或 1.
  • skip_empty:一個(gè) bool;如果為 True,則從結(jié)果中跳過(guò)空字符串.

函數(shù)返回值:

tf.string_split函數(shù)返回一個(gè)秩為 2 的 SparseTensor,字符串根據(jù)分隔符拆分.索引的第一列對(duì)應(yīng)于 source 中行的內(nèi)容,第二列對(duì)應(yīng)于此行中拆分組件的索引.

可能引發(fā)的異常:

  • ValueError:如果分隔符(delimiter)不是字符串.
以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)