App下載

C語(yǔ)言的字符串如何轉(zhuǎn)換為Python語(yǔ)言的字符串 實(shí)現(xiàn)方法分享

葬愛家族形象代言人 2021-08-19 14:26:32 瀏覽數(shù) (3451)
反饋

將一門語(yǔ)言轉(zhuǎn)換為另一門語(yǔ)言,大家是不是覺得很奇幻?其實(shí)這個(gè)不難,下面就為大家介紹一下將C語(yǔ)言中的字符串轉(zhuǎn)換為Python語(yǔ)言的字符串。下面是詳情內(nèi)容,供大家學(xué)習(xí)參考。

問(wèn)題

怎樣將C中的字符串轉(zhuǎn)換為Python字節(jié)或一個(gè)字符串對(duì)象?

解決方案

C字符串使用一對(duì) char *int 來(lái)表示, 你需要決定字符串到底是用一個(gè)原始字節(jié)字符串還是一個(gè)Unicode字符串來(lái)表示。 字節(jié)對(duì)象可以像下面這樣使用 Py_BuildValue() 來(lái)構(gòu)建:

char *s; /* Pointer to C string data */
int len; /* Length of data */

/* Make a bytes object */
PyObject *obj = Py_BuildValue("y#", s, len);

如果你要?jiǎng)?chuàng)建一個(gè)Unicode字符串,并且你知道 s 指向了UTF-8編碼的數(shù)據(jù),可以使用下面的方式:

PyObject *obj = Py_BuildValue("s#", s, len);

如果 s 使用其他編碼方式,那么可以像下面使用 PyUnicode_Decode() 來(lái)構(gòu)建一個(gè)字符串:

PyObject *obj = PyUnicode_Decode(s, len, "encoding", "errors");

/* Examples /*
obj = PyUnicode_Decode(s, len, "latin-1", "strict");
obj = PyUnicode_Decode(s, len, "ascii", "ignore");

如果你恰好有一個(gè)用 wchar_t *, len 對(duì)表示的寬字符串, 有幾種選擇性。首先你可以使用 Py_BuildValue()

wchar_t *w; /* Wide character string */
int len; /* Length */

PyObject *obj = Py_BuildValue("u#", w, len);

另外,你還可以使用 PyUnicode_FromWideChar() :

PyObject *obj = PyUnicode_FromWideChar(w, len);

對(duì)于寬字符串,并沒有對(duì)字符數(shù)據(jù)進(jìn)行解析——它被假定是原始Unicode編碼指針,可以被直接轉(zhuǎn)換成Python。

討論

將C中的字符串轉(zhuǎn)換為Python字符串遵循和I/O同樣的原則。 也就是說(shuō),來(lái)自C中的數(shù)據(jù)必須根據(jù)一些解碼器被顯式的解碼為一個(gè)字符串。 通常編碼格式包括ASCII、Latin-1和UTF-8. 如果你并不確定編碼方式或者數(shù)據(jù)是二進(jìn)制的,你最好將字符串編碼成字節(jié)。 當(dāng)構(gòu)造一個(gè)對(duì)象的時(shí)候,Python通常會(huì)復(fù)制你提供的字符串?dāng)?shù)據(jù)。 如果有必要的話,你需要在后面去釋放C字符串。 同時(shí),為了讓程序更加健壯,你應(yīng)該同時(shí)使用一個(gè)指針和一個(gè)大小值, 而不是依賴NULL結(jié)尾數(shù)據(jù)來(lái)創(chuàng)建字符串。

以上就是C語(yǔ)言字符串轉(zhuǎn)換為Python字符串的方法的詳細(xì)內(nèi)容,更多關(guān)于C語(yǔ)言字符串轉(zhuǎn)換為Python字符串的資料,請(qǐng)關(guān)注W3Cschool其它相關(guān)文章!

C

0 人點(diǎn)贊