PHP htmlentities() 函數(shù)

PHP String 參考手冊(cè) PHP String 參考手冊(cè)

實(shí)例

把一些字符轉(zhuǎn)換為 HTML 實(shí)體:

<?php
$str = "<© W3CS?h°°|§>";
echo htmlentities($str);
?>

上面代碼的 HTML 輸出如下(查看源代碼):

<!DOCTYPE html>
<html>
<body>
&lt;&copy; W3CS&ccedil;h&deg;&deg;&brvbar;&sect;&gt;
</body>
</html>

上面代碼的瀏覽器輸出如下:

<© W3CS?h°°|§>

運(yùn)行實(shí)例 ?

定義和用法

htmlentities() 函數(shù)把字符轉(zhuǎn)換為 HTML 實(shí)體。

提示:要把 HTML 實(shí)體轉(zhuǎn)換回字符,請(qǐng)使用html_entity_decode() 函數(shù)。

提示:請(qǐng)使用get_html_translation_table() 函數(shù)來(lái)返回 htmlentities() 使用的翻譯表。


語(yǔ)法

htmlentities(string,flags,character-set,double_encode)

參數(shù)描述
string必需。規(guī)定要轉(zhuǎn)換的字符串。
flags可選。規(guī)定如何處理引號(hào)、無(wú)效的編碼以及使用哪種文檔類型。

可用的引號(hào)類型:

  • ENT_COMPAT - 默認(rèn)。僅編碼雙引號(hào)。
  • ENT_QUOTES - 編碼雙引號(hào)和單引號(hào)。
  • ENT_NOQUOTES - 不編碼任何引號(hào)。

無(wú)效的編碼:

  • ENT_IGNORE - 忽略無(wú)效的編碼,而不是讓函數(shù)返回一個(gè)空的字符串。應(yīng)盡量避免,因?yàn)檫@可能對(duì)安全性有影響。
  • ENT_SUBSTITUTE - 把無(wú)效的編碼替代成一個(gè)指定的帶有 Unicode 替代字符 U+FFFD(UTF-8)或者 &#FFFD; 的字符,而不是返回一個(gè)空的字符串。
  • ENT_DISALLOWED - 把指定文檔類型中的無(wú)效代碼點(diǎn)替代成 Unicode 替代字符 U+FFFD(UTF-8)或者 &#FFFD;。

規(guī)定使用的文檔類型的附加 flags:

  • ENT_HTML401 - 默認(rèn)。作為 HTML 4.01 處理代碼。
  • ENT_HTML5 - 作為 HTML 5 處理代碼。
  • ENT_XML1 - 作為 XML 1 處理代碼。
  • ENT_XHTML - 作為 XHTML 處理代碼。
character-set可選。一個(gè)規(guī)定了要使用的字符集的字符串。

允許的值:

  • UTF-8 - 默認(rèn)。ASCII 兼容多字節(jié)的 8 位 Unicode
  • ISO-8859-1 - 西歐
  • ISO-8859-15 - 西歐(加入歐元符號(hào) + ISO-8859-1 中丟失的法語(yǔ)和芬蘭語(yǔ)字母)
  • cp866 - DOS 專用 Cyrillic 字符集
  • cp1251 - Windows 專用 Cyrillic 字符集
  • cp1252 - Windows 專用西歐字符集
  • KOI8-R - 俄語(yǔ)
  • BIG5 - 繁體中文,主要在臺(tái)灣使用
  • GB2312 - 簡(jiǎn)體中文,國(guó)家標(biāo)準(zhǔn)字符集
  • BIG5-HKSCS - 帶香港擴(kuò)展的 Big5
  • Shift_JIS - 日語(yǔ)
  • EUC-JP - 日語(yǔ)
  • MacRoman - Mac 操作系統(tǒng)使用的字符集

注釋:在 PHP 5.4 之前的版本,無(wú)法被識(shí)別的字符集將被忽略并由 ISO-8859-1 替代。自 PHP 5.4 起,無(wú)法被識(shí)別的字符集將被忽略并由 UTF-8 替代。

double_encode可選。一個(gè)規(guī)定了是否編碼已存在的 HTML 實(shí)體的布爾值。
  • TRUE - 默認(rèn)。將對(duì)每個(gè)實(shí)體進(jìn)行轉(zhuǎn)換。
  • FALSE - 不會(huì)對(duì)已存在的 HTML 實(shí)體進(jìn)行編碼。

技術(shù)細(xì)節(jié)

返回值:返回已轉(zhuǎn)換的字符串。

如果 string 包含無(wú)效的編碼,則返回一個(gè)空的字符串,除非設(shè)置了 ENT_IGNORE 或者 ENT_SUBSTITUTE 標(biāo)志。
PHP 版本:4+
更新日志:在 PHP 5 中,character-set 參數(shù)的默認(rèn)值改為 UTF-8。

在 PHP 5.4 中,新增了:ENT_SUBSTITUTE、ENT_DISALLOWED、ENT_HTML401、ENT_HTML5、ENT_XML1 和 ENT_XHTML。

在 PHP 5.3 中,新增了 ENT_IGNORE。

在 PHP 5.2.3 中,新增了 double_encode 參數(shù)。

在 PHP 4.1 中,新增了 character-set 參數(shù)。


更多實(shí)例

實(shí)例 1

把一些字符轉(zhuǎn)換為 HTML 實(shí)體:

<?php
$str = "Jane & 'Tarzan'";
echo htmlentities($str, ENT_COMPAT); // Will only convert double quotes
echo "<br>";
echo htmlentities($str, ENT_QUOTES); // Converts double and single quotes
echo "<br>";
echo htmlentities($str, ENT_NOQUOTES); // Does not convert any quotes
?>

上面代碼的 HTML 輸出如下(查看源代碼):

<!DOCTYPE html>
<html>
<body>
Jane &amp; 'Tarzan'<br>
Jane &amp; &#039;Tarzan&#039;<br>
Jane &amp; 'Tarzan'
</body>
</html>

上面代碼的瀏覽器輸出如下:

Jane & 'Tarzan'
Jane & 'Tarzan'
Jane & 'Tarzan'

運(yùn)行實(shí)例 ?

實(shí)例 2

通過(guò)使用西歐字符集,把一些字符轉(zhuǎn)換為 HTML 實(shí)體:

<?php
$str = "My name is ?yvind ?sane. I'm Norwegian.";
echohtmlentities($str, ENT_QUOTES, "ISO-8859-1"); // Will only convertdouble quotes (not single quotes), and uses the character-set WesternEuropean
?>

上面代碼的 HTML 輸出如下(查看源代碼):

<!DOCTYPE html>
<html>
<body>
My name is &Oslash;yvind&Aring;sane. I&#039;m Norwegian.
</body>
</html>

上面代碼的瀏覽器輸出如下:

My name is ?yvind ?sane. I'm Norwegian.

運(yùn)行實(shí)例 ?


PHP String 參考手冊(cè) PHP String 參考手冊(cè)