Атрибуты. Парсинг

    Одной строки настроек достаточно, чтобы спарсить все атрибуты, которые имеются на веб странице.

    Допустим, ссылка на веб-страницу сайта-донора находится в колонке 12, а атрибуты располагаются в области, ограниченной параметрами id="tab-specification"> и </table

    Следовательно, "Тексты начала и конца парсинга" будут: id="tab-specification">,</table

    Названия атрибутов ограничено текстами <td> и </td>, также, как и значения. Следовательно, параметры парсинга будут: <td>,</td,<td>,</

    Итоговые настройки:

    - номер колонки 12 необходимо прописать здесь:

    - дать разрешение на загрузку атрибутов:


    P.S. В колонке 12 прайс листа может находится не ссылка для парсинга, а описание товара, содержащее атрибуты:

    в таком случае, можно парсить текст описания в атрибуты. Параметры те же.

    Выводы.

    • Для парсинга атрибутов, номер колонки, содержащей ссылку на веб-страницу необходимо указывать на главной странице формы поставщика, в полосе "Название товара"
    • Заполнение вкладки "Атрибуты" параметрами парсинга, не является достаточным условием для парсинга атрибутов: нужно еще дать разрешение на загрузку на главной странице формы
    • Для парсинга атрибутов недостаточно двух параметров (как для парсинга названия или описания). Нужно 4 параметра: 2 для названия атрибута и 2 параметра для значения атрибута.

    Исключения.

    1. В некоторых ситуациях, используется не 4 параметра, а 3. Например:

    Здесь, второй параметр названия атрибута - точка с запятой, является одновременно первым параметром значения атрибута. Следовательно, получается всего 3 параметра:

    и этого достаточно.

    2. Можно парсить атрибуты по-отдельности, индивидуально. Например, нужно взять только один атрибут: "Тип" (см. пример веб страницы выше):

    В таких случаях, используется только 2 параметра парсинга, но "Тексты начала и конца парсинга", тут, как правило, обязательны.

    usergio Copyright © 2022