加入收藏 | 设为首页 | 会员中心 | 我要投稿 安卓应用网 (https://www.0791zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > PHP > 正文

怎样使用PHP自动检测并移除UTF-8文件的BOM

发布时间:2020-05-25 10:44:36 所属栏目:PHP 来源:互联网
导读:介绍《怎样使用PHP自动检测并移除UTF-8文件的BOM》开发教程,希望对您有用。

《怎样使用PHP自动检测并移除UTF-8文件的BOM》要点:
本文介绍了怎样使用PHP自动检测并移除UTF-8文件的BOM,希望对您有用。如果有疑问,可以联系我们。

大家有没有这样的体验:有时你看着文件是乱码,但是已声明或修改了页面的编码,但仍然是乱码。

这时,这个页面存在BOM的可能性是很大。


什么是BOM?对于一些CMS或程序,需要在线自动检测BOM并清理,那要怎么做?


BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。

但PHP在读取文件时会把这些字符读出,从而形成了文件开头含有一些无法识别的字符的问题。


比如用UTF-8格式保存的生成图片的PHP文件,因为文件头隐藏的BOM信息也被下发,导致生成的图片数据不对,浏览器无法识别。


要检测一个UTF-8文件是否含有BOM信息,就是检测文件开头的字三个符,是否为0xEF,0xBB,0xBF。下面这个小程序,用户遍历某个目录下所有文件,并检测是否加了BOM。


//此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除
$basedir="."; //修改此行为需要检测的目录,点表示当前目录
$auto=1; //是否自动移除发现的BOM信息。1为是,0为否。

//以下不用改动

if ($dh = opendir($basedir)) {
       while (($file = readdir($dh)) !== false) {
              if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) 
                     echo "filename: $file ".checkBOM("$basedir/$file")."";
       }
       closedir($dh);
}

function checkBOM ($filename) {
       global $auto;
       $contents=file_get_contents($filename);
       $charset[1]=substr($contents, 0, 1);
       $charset[2]=substr($contents, 1, 1);
       $charset[3]=substr($contents, 2, 1);
       if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
              if ($auto==1) {
                     $rest=substr($contents, 3);
                     rewrite ($filename, $rest);
                     return ("<span style="FONT-FAMILY: ; COLOR: red">BOM found, automatically removed.</span>");
} else {
                     return ("<span style="FONT-FAMILY: ; COLOR: red">BOM found.</span>");
}
       }
       else return ("BOM Not Found.");
}

function rewrite ($filename, $data) {
       $filenum=fopen($filename,"w");
       flock($filenum,LOCK_EX);
       fwrite($filenum,$data);
       fclose($filenum);
}


#以下这个函数常用:
//清理UTF-8的BOM头:检测文件开头的字三个符,是否为0xEF, 0xBB, 0xBF
//$reCon = true 返回值是内容,false是bool是否包含BOM
function cleanBom($content,$reCon=true)
{
       if(empty($content)) return $content;
       $charset[1]=substr($content, 1);
       $charset[2]=substr($content, 1);
       $charset[3]=substr($content, 1);
       $cleanContent = false;
       if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191)
       {
              $cleanContent = $reCon ? substr($content, 3) : true;
       }
       return $cleanContent;
}



将以上代码另存为 checkBOM.php,修改需要检测的目录后运行。这样可能有助于检测是哪个文件带有了BOM信息导致所有页面开头都有那么一段空白。

(编辑:安卓应用网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读