例 7.1. Perl正则去除html的tag
想要将html
<h1>h1 content</h1>
<div>
div test
</div>
<invalidTag> invalid tag test </invalid>
中的标签tag去掉,变成:
h1 content
div test
<invalidTag> invalid tag test </invalid>
用的perl的正则的代码是:
$filteredHtml =~ s/<(\w+?)>(.+?)<\/\1>/$2/sg;
详细代码可参考【已解决】Perl中的正则表达式的替换和后向引用