Ссылки на чужие сайты в PHP
В реальной жизни на сайте может быть мешанина из абсолютных, относительных путей и путей на чужие сайты. Нам нужно уметь отсекать ссылки, ведущие на чужой сайт.
Пусть targ.loc
- это сайт,
который мы парсим.
Получите массив href
, ведущих
на этот сайт, выполните их нормализацию,
исключив при этом ссылки на чужие сайты:
<a href="page.html">text</a>
<a href="./page.html">text</a>
<a href="../page.html">text</a>
<a href="http://targ.loc/page.html">text</a>
<a href="https://targ.loc/page.html">text</a>
<a href="http://othr.com/dir/page.html">text</a>
<a href="https://othr.com/dir/page.html">text</a>