Проблема пробелов при парсинге атрибутов через регулярки в PHP
В атрибуте вокруг равно могут быть пробелы:
<img src="1.png">
<img src ="2.png">
<img src = "3.png">
<img src
="4.png">
Давайте учтем это в нашей регулярке:
<?php
preg_match_all('#src\s*=\s*"(.+?)"#su', $str, $matches, PREG_PATTERN_ORDER);
?>
Проверим, что все работает:
<?php
var_dump($matches[1]);
?>
Найдите содержимое всех атрибутов href
:
<a href="page1.html">link1</a>
<a href ='page2.html'>link2</a>
<a href = 'page3.html'>link3</a>
<a href
=
"page4.html"
>link4</a>