Tidy is a binding for the Tidy HTML clean and repair utility
Tidy是一种整理和修复你的HTML的工具,支持面向对象或面向过程方式调用,下面简单说说它的用法:
1)对象方式
<?php
$html = '<p>test</I>'; //要处理的字串
$tidy = new tidy;
$tidy->parseString($html);
$tidy->CleanRepair();
echo tidy_get_output($tidy); //输出处理后的结果
?>
2)过程方式
<?php
$html =" <p>error<br>another line</i>";
$config = array('indent' => TRUE,
'output-xhtml' => TRUE,
'wrap' => 200);
$tidy = tidy_parse_string($buffer, $config, 'UTF8'); //返回的是tidy对象
$tidy->CleanRepair($tidy);
echo tidy_get_output($tidy); //输出处理后的结果
?>
<?php
$html =" <p>error<br>another line</i>";
$config = array('indent' => TRUE,
'output-xhtml' => TRUE,
'wrap' => 200);
$tidy = tidy_repair_string($html, $config, 'UTF8'); //返回的是tidy对象
echo $tidy;
?>
其它函数:
tidy tidy_parse_file //需要用tidy_get_X系列处理返回
String tidy_repair_file //可以直接echo
tidy tidy_parse_string
String tidy_repair_string
如果你需要单独处理HTML内容的某些指定标记,需要用tidy_parse_*配合tidy_clean_repair使用,并使用tidy_get_*系列输出结果(tidy_get_*接受的参数为tidy对象)
如果只是对整个内容简单处理并输出,直接用tidy_repair_*处理并返回结果字串,再echo就可以了
tidy_get_body //返回body标记部分
tidy_get_config //返回参数配置 ,具体配置请参阅http://tidy.sourceforge.net/docs/quickref.html
tidy_get_head //head标记部分
tidy_get_html //html部分(全文?)