olamedia / nokogiri

HTML parser for PHP - Парсер HTML

Home Page:http://olamedia.github.com/nokogiri/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

fromDom() и toText и версия libxml

Niremizov opened this issue · comments

Полагаю в README есть смысл добавить в Requirements информацию о минимальной версии libxml. Обнаружил при использовании Libxml версии 2.7.8 - появляется следующее поведение:

Функция:
`
public function getDomElementsText($dom_element) {

$parser = nokogiri::fromDom($dom_element);

return $parser->toText();

}
`

На выходе вернет HTML/текст в неверной кодировке, думал проблема в версии PHP, но обновление до 5.5 не помогло. Сменил libxml на 2.9.2 и HTML на выходе нормальный в UTF8.

есть возможность проверить другие версии? чтобы указать минимальную для работы...
хмм... 2.7.8 похоже вышла за два года выхода нокогири, при этом следующая версия 2.8.0 вышла на месяц позже нокогири.

Нет, к сожалению, сейчас возможности потестировать нет.