Получение кодировки страницы при парсинге на PHP
В настоящее время стандартной кодировкой
является utf-8
и в HTML страницах
она указывается следующим образом:
<meta charset="utf-8">
Вы, однако, можете столкнутся со старыми сайтами, в которых кодировка указывалась следующим образом:
<meta http-equiv="content-type" content="text/html; charset=utf-8">
Кроме того, на старых сайтах вместо
кодировки utf-8
можно встретить
устаревшую кодировку windows-1251
:
<meta http-equiv="content-type" content="text/html; charset=windows-1251">
Напишите функцию, которая будет определять
кодировку HTML страницы по тегу meta
.