|
对php使用正则去除网页中所有的 html,js,css,注释感兴趣的小伙伴,下面一起跟随脚本之家 jb51.cc的小编两巴掌来看看吧!
/**
* php使用正则去除网页中所有的 html,注释
*
* @param
* @arrange 512-笔记网: jb51.cc
**/
$search = array ("'<script[^>]*?>.*?</script>'si",// 去掉 javascript
"'<style[^>]*?>.*?</style>'si",// 去掉 css
"'<[/!]*?[^<>]*?>'si",// 去掉 HTML 标记
"'<!--[/!]*?[^<>]*?>'si",// 去掉 注释 标记
"'([rn])[s]+'",// 去掉空白字符
"'&(quot|#34);'i",// 替换 HTML 实体
"'&(amp|#38);'i","'&(lt|#60);'i","'&(gt|#62);'i","'&(nbsp|#160);'i","'&(iexcl|#161);'i","'&(cent|#162);'i","'&(pound|#163);'i","'&(copy|#169);'i","'&#(d+);'e"); // 作为 PHP 代码运行
$replace = array ("","","1",""","&","<",">"," ",chr(161),chr(162),chr(163),chr(169),"chr(1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search,$replace,$document);
/*** 来自脚本之家 jb51.cc(jb51.cc) ***/ 也可以使用php的内置函数strip_tags()清除html,注释等标记 (编辑:安卓应用网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|