четверг, 26 марта 2009 г.

Парсинг DLE

Процесс по открытию шестого сайта дошел до стадии создания шаблона. Материал сграблен, раскидан по папкам и залит в базу. Но вообще беспроблемно спарсить DLE сайт у меня не получилось. Оказывается, что краткая версия (описание) и подробная версия - могут быть совершенно разными! А я думал, гадал, почему скрипт на каждой новости спотыкается.

Еще одна проблема, самая важная - админ ресурса. Точнее его руки, которые растут из задницы. Тонна левых тегов, пустых тегов + куча вариантов, когда жирным выделена лишь часть слова (не знаю, как так можно выделять).

Но в итоге я все-таки довел скрипт и получил на выходе 615 уникальных записей (три раздела) и 11 записей не прошли из-за различных ошибок.

Теперь надо быстрее делать дизайн и запускать проект.

Комментариев нет:

Отправить комментарий