如何用正则表达式排除HTML代码中中文加冒号的字符串?(冒号.字符串.中文.如何用.排除...)
正则表达式:排除中文加冒号格式字符串
匹配 html 代码中两个
标签之间内容时,遇到中文加冒号的格式(如:“张无忌:”),传统正则表达式会把这些内容也匹配到,导致结果不符合预期。为了排除中文加冒号格式字符串,我们可以使用负向前瞻断言,即:preg_match_all('/
(?!.*[x{4e00}-x{9fa5}:]).*/u', $input, $matches);- : 匹配 标签开始符
- (?!.*[x{4e00}-x{9fa5}:]).*: 负向前瞻断言,确保其后没有中文加冒号的子串
-
: 匹配 标签结束符
示例:
$input = '<td>我是张三分</td> <td>张无忌: 你真的是张三分?</td>'; preg_match_all('/<td>(?!.*[x{4e00}-x{9fa5}:]).*</td>/u', $input, $matches); print_r($matches[0]);
输出:
Array ( [0] => <td>我是张三分</td> )
如你所见,符合条件的只有没有中文加冒号的字符串。
以上就是如何用正则表达式排除HTML代码中中文加冒号的字符串?的详细内容,更多请关注知识资源分享宝库其它相关文章!