1:40 am
May 30, 2017
В общем, попробовал спарсить эту ленту вордпрессовскую. Там всего три статьи, поэтому больше из чувства эксперементирования
Login to see this link
Из настроек выбрал парсить из архива и сохранять картинки локально у меня на сайте. Плюс, отрезаю часть ненужного контента $post['post_content'] = preg_replace('/<div class="wp_rp_content">.*?<\/div>/is', "", $post['post_content']);
Что интересно, первые две статьи парсит, но картинки на мой сайт не вытягивает и ссылки в статье уходят на тот сайт. Из последней статьи "Утепление бани изнутри" все вытягивает и картинки выкладывает на мой сайт. В чем косяк, понять не могу :) Скорее всего в кривых руках, но пробовал на двух сайтах с одинаковыми настройками, результат одинаковый. Из двух статей не может вытянуть картинки, из одной может.
А там ссылки на картинки в кириллице. Например: Login to see this link
В первом же ссылка такая: Login to see this link
Это глюк скрипта, который выдергивает полный контекст статьи. Там у них на сайте есть новая версия, которая вроде как работает с национальными кодировками, но пока что она платная. Я конечно мог бы купить и выложить для скачивания - GPL лицензия это позволяет, но кодерская этика - нет.
8:52 pm
May 30, 2017
Еще немного поразмышлял над картинками. По моему скромному разумению, скрипт правильно вытягивает картинку на мой сайт, это скорее плагин подтупливает над русскими буквами. Вот что получается:
Login to see the code
Судя по коду, картинка вытянулась, плагин WP Translitera преобразовал в транслит и картинка по этому адресу открывается. А дальше идут ссылки на старый сайт. Кириллические. По моей логике это уже работа плагина правильно эти ссылки расставить в статье.
7:55 am
May 30, 2017
Еще немного поэкспериментировал, если в статье просто убираешь код и оставляешь такой, то картинки в статье появляются:
Login to see the code
Видимо теперь придется думать, как это PHP кодом вырезать. Подсказали бы идею... :) От символа до символа с вырезанием последнего я умею, а вот вырезать до alt и его оставить пока проблема.
Most Users Ever Online: 541
Currently Online: rumitus
18 Guest(s)
Currently Browsing this Page:
1 Guest(s)
Top Posters:
ninja321: 84
s.baryshev.aoasp: 68
Freedom: 61
Pandermos: 54
MediFormatica: 49
B8europe: 48
Member Stats:
Guest Posters: 337
Members: 2817
Moderators: 0
Admins: 1
Forum Stats:
Groups: 1
Forums: 5
Topics: 1627
Posts: 8280
Newest Members:
igor.buzaev, jeremyboucher, lthompson2709, MAC, duty3canada, backlinkmoroccoAdministrators: CyberSEO: 3913