PHP htmlspecialchars() 函數(shù)

2018-11-18 18:08 更新

PHP htmlspecialchars() 函數(shù)

PHP String 參考手冊(cè) PHP String 參考手冊(cè)

實(shí)例

把預(yù)定義的字符 "<" (小于)和 ">" (大于)轉(zhuǎn)換為 HTML 實(shí)體:

<?php
$str = "This is some <b>bold</b> text.";
echo htmlspecialchars($str);
?>

上面代碼的 HTML 輸出如下(查看源代碼):

<!DOCTYPE html>
<html>
<body>
This is some &lt;b&gt;bold&lt;/b&gt; text.
</body>
</html>

上面代碼的瀏覽器輸出如下:

This is some <b>bold</b> text.

運(yùn)行實(shí)例 ?

定義和用法

htmlspecialchars() 函數(shù)把一些預(yù)定義的字符轉(zhuǎn)換為 HTML 實(shí)體。

預(yù)定義的字符是:

  • & (和號(hào))成為 &amp;
  • " (雙引號(hào))成為 &quot;
  • ' (單引號(hào))成為 '
  • < (小于)成為 &lt;
  • > (大于)成為 &gt;

提示:要把特殊的 HTML 實(shí)體轉(zhuǎn)換回字符,請(qǐng)使用 htmlspecialchars_decode() 函數(shù)。


語(yǔ)法

htmlspecialchars(string,flags,character-set,double_encode)

參數(shù) 描述
string 必需。規(guī)定要轉(zhuǎn)換的字符串。
flags 可選。規(guī)定如何處理引號(hào)、無(wú)效的編碼以及使用哪種文檔類(lèi)型。

可用的引號(hào)類(lèi)型:

  • ENT_COMPAT - 默認(rèn)。僅編碼雙引號(hào)。
  • ENT_QUOTES - 編碼雙引號(hào)和單引號(hào)。
  • ENT_NOQUOTES - 不編碼任何引號(hào)。

無(wú)效的編碼:

  • ENT_IGNORE - 忽略無(wú)效的編碼,而不是讓函數(shù)返回一個(gè)空的字符串。應(yīng)盡量避免,因?yàn)檫@可能對(duì)安全性有影響。
  • ENT_SUBSTITUTE - 把無(wú)效的編碼替代成一個(gè)指定的帶有 Unicode 替代字符 U+FFFD(UTF-8)或者 &#FFFD; 的字符,而不是返回一個(gè)空的字符串。
  • ENT_DISALLOWED - 把指定文檔類(lèi)型中的無(wú)效代碼點(diǎn)替代成 Unicode 替代字符 U+FFFD(UTF-8)或者 &#FFFD;。

規(guī)定使用的文檔類(lèi)型的附加 flags:

  • ENT_HTML401 - 默認(rèn)。作為 HTML 4.01 處理代碼。
  • ENT_HTML5 - 作為 HTML 5 處理代碼。
  • ENT_XML1 - 作為 XML 1 處理代碼。
  • ENT_XHTML - 作為 XHTML 處理代碼。
character-set 可選。一個(gè)規(guī)定了要使用的字符集的字符串。

允許的值:

  • UTF-8 - 默認(rèn)。ASCII 兼容多字節(jié)的 8 位 Unicode
  • ISO-8859-1 - 西歐
  • ISO-8859-15 - 西歐(加入歐元符號(hào) + ISO-8859-1 中丟失的法語(yǔ)和芬蘭語(yǔ)字母)
  • cp866 - DOS 專(zhuān)用 Cyrillic 字符集
  • cp1251 - Windows 專(zhuān)用 Cyrillic 字符集
  • cp1252 - Windows 專(zhuān)用西歐字符集
  • KOI8-R - 俄語(yǔ)
  • BIG5 - 繁體中文,主要在臺(tái)灣使用
  • GB2312 - 簡(jiǎn)體中文,國(guó)家標(biāo)準(zhǔn)字符集
  • BIG5-HKSCS - 帶香港擴(kuò)展的 Big5
  • Shift_JIS - 日語(yǔ)
  • EUC-JP - 日語(yǔ)
  • MacRoman - Mac 操作系統(tǒng)使用的字符集

注釋?zhuān)?/strong>在 PHP 5.4 之前的版本,無(wú)法被識(shí)別的字符集將被忽略并由 ISO-8859-1 替代。自 PHP 5.4 起,無(wú)法被識(shí)別的字符集將被忽略并由 UTF-8 替代。

double_encode 可選。一個(gè)規(guī)定了是否編碼已存在的 HTML 實(shí)體的布爾值。
  • TRUE - 默認(rèn)。將對(duì)每個(gè)實(shí)體進(jìn)行轉(zhuǎn)換。
  • FALSE - 不會(huì)對(duì)已存在的 HTML 實(shí)體進(jìn)行編碼。

技術(shù)細(xì)節(jié)

返回值: 返回已轉(zhuǎn)換的字符串。

如果 string 包含無(wú)效的編碼,則返回一個(gè)空的字符串,除非設(shè)置了 ENT_IGNORE 或者 ENT_SUBSTITUTE 標(biāo)志。
PHP 版本: 4+
更新日志: 在 PHP 5 中,character-set 參數(shù)的默認(rèn)值改為 UTF-8。

在 PHP 5.4 中,新增了:ENT_SUBSTITUTE、ENT_DISALLOWED、ENT_HTML401、ENT_HTML5、ENT_XML1 和 ENT_XHTML。

在 PHP 5.3 中,新增了 ENT_IGNORE。

在 PHP 5.2.3 中,新增了 double_encode 參數(shù)。

在 PHP 4.1 中,新增了 character-set 參數(shù)。


更多實(shí)例

實(shí)例 1

把一些預(yù)定義的字符轉(zhuǎn)換為 HTML 實(shí)體:

<?php
$str = "Jane & 'Tarzan'";
echo htmlspecialchars($str, ENT_COMPAT); // Will only convert double quotes
echo "<br>";
echo htmlspecialchars($str, ENT_QUOTES); // Converts double and single quotes
echo "<br>";
echo htmlspecialchars($str, ENT_NOQUOTES); // Does not convert any quotes
?>

上面代碼的 HTML 輸出如下(查看源代碼):

<!DOCTYPE html>
<html>
<body>
Jane &amp; 'Tarzan'<br>
Jane &amp; 'Tarzan'<br>
Jane &amp; 'Tarzan'
</body>
</html>

上面代碼的瀏覽器輸出如下:

Jane & 'Tarzan'
Jane & 'Tarzan'
Jane & 'Tarzan'

運(yùn)行實(shí)例 ?

實(shí)例 2

把雙引號(hào)轉(zhuǎn)換為 HTML 實(shí)體:

<?php
$str = 'I love "PHP".';
echo htmlspecialchars($str, ENT_QUOTES); // Converts double and single quotes
?>

上面代碼的 HTML 輸出如下(查看源代碼):

<!DOCTYPE html>
<html>
<body>
I love &quot;PHP&quot;.
</body>
</html>

上面代碼的瀏覽器輸出如下:

I love "PHP".

運(yùn)行實(shí)例 ?


PHP String 參考手冊(cè) PHP String 參考手冊(cè)
以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)