4 подписчика

Java Selenide. XPATH

8 ноября 20248 ноя 2024

7 мин

XPath - язык запросов к xml документу, который часто используется при поиске DOM - элементов сайта. XPath включает в себя следующие понятия: 1. УЗЕЛ - Элемент дерева документа 2. Путь - путь пройденный к искомому узлу 3. Ось - вектор движения запроса XPath состоит из последовательности блоков (пути) до определенного узла, каждый из которых строится следующим образом: //*ТЕГ*[@*АТРИБУТ* *УСЛОВИЕ* '*ЗНАЧЕНИЕ АТРИБУТА*'] К примеру, .//div[@class='button-wrapper']/input[@type='button'] В данном примере, в первом блоке выполняется поиск div-узла с классом 'button-wrapper'. Во втором блоке ищет потомка с атрибутом 'type' равным 'button'. Стоит упомянуть, что вместо тега можно поставить "*", что означает "Любой" Для дальнейшего понимания статьи составим небольшой html документ в виде дерева: XPath по своей сути говорит как дойти до того или иного узла. Указать путь возможно двумя способами: 1. Абсолютным путем 2. Относительным путем Абсолютный путь формируется от верхнего узла (html) до ис

Оглавление

Синтаксис
Пути
Абсолютный путь

XPath - язык запросов к xml документу, который часто используется при поиске DOM - элементов сайта. XPath включает в себя следующие понятия:

1. УЗЕЛ - Элемент дерева документа

2. Путь - путь пройденный к искомому узлу

3. Ось - вектор движения запроса

Синтаксис

XPath состоит из последовательности блоков (пути) до определенного узла, каждый из которых строится следующим образом:

//*ТЕГ*[@*АТРИБУТ* *УСЛОВИЕ* '*ЗНАЧЕНИЕ АТРИБУТА*']

К примеру,

.//div[@class='button-wrapper']/input[@type='button']

В данном примере, в первом блоке выполняется поиск div-узла с классом 'button-wrapper'. Во втором блоке ищет потомка с атрибутом 'type' равным 'button'.

Стоит упомянуть, что вместо тега можно поставить "*", что означает "Любой"

Для дальнейшего понимания статьи составим небольшой html документ в виде дерева:

Пути

XPath по своей сути говорит как дойти до того или иного узла. Указать путь возможно двумя способами:

1. Абсолютным путем

2. Относительным путем

Абсолютный путь

Абсолютный путь формируется от верхнего узла (html) до искомого (к примеру, на графе возьмем DIV ID=C3).

Путь начинается с '/'.

Построим XPath по методу абсолютного пути:

/html/body/div[@id='C1']/div[@id='C3']

Данный запрос проведет нас по пути, показанному на рисунке ниже

Как видно, путь начался с узла html и следовал по всем остановкам до конечной.

Относительный путь

Относительный путь формируется от начального узла, который отвечает условиям поиска, к конечному.

Путь начинается с '//'.

Для примера возьмем элемент DIV ID=B1 и найдем в нем потомка DIV ID=B3 и составим запрос:

//div[@id='B1']/div[@id='B3']

В итоге мы пройдем путь на картинке ниже:

Путь. пройденный по XPath (//div[@id='B1']/div[@id='B3'])

Как видно, относительный путь выглядит короче, но абсолютный путь более производительный, так как отбрасывает ответвления, однако, есть важное замечание "Абсолютный путь не приемлет изменений", т.е. если на страницу добавить новый элемент, то XPath ломается. Следовательно, относительный путь более предпочтителен.

Условия

В XPath есть три классических логических условий: AND, OR, NOT

Оператор OR - логическое или. Вспоминая булевскую алгебру: истинна будет, когда один из частей выражения является истинной. Внизу оставлю таблицу истинности

| А | B | Результат |

| 0 | 0 | 0 |

| 0 | 1 | 1 |

| 1 | 0 | 1 |

| 1 | 1 | 1 |

Для примера получим три дочерних элемента 'BODY' с помощью условного оператора OR (ИЛИ):

Составим XPath:

//div[@id='A1' OR @id='B1' OR @id='C1']

В итоге получаем необходимые элементы

Поиск с помощью условного оператора OR (ИЛИ)

Оператор AND - логическое И. Истинной будет, когда все части выражения истинны.

Таблица истинности

| А | B | Результат |

| 0 | 0 | 0 |

| 0 | 1 | 0 |

| 1 | 0 | 0 |

| 1 | 1 | 1 |

Для понимания работы оператора AND (И) добавим дополнительные узлы и атрибут (изменения обведены красной рамкой).

Итак, для того чтобы найти элемент [DIV ID=A1 ARIA=2] составим следующий запрос:

//div[@aria='2' and @id='A1']

В итоге найдем нужный элемент.

Поиск с помощью условного оператора AND (И)

Оператор NOT - Логическое отрицание.

Таблица истинности

| А | Результат |

| 0 | 1 |

| 1 | 0 |

Для проверки работы логического отрицания NOT найдем другой элемент из созданных. Составим запрос XPath:

//div[@aria='2' and not(@id='A1')]

В итоге получим искомый элемент

Поиск с помощью условного оператора NOT (Не)

ОСИ

Оси необходимы, чтобы мы смогли указать как и в какую сторону будем двигаться по пути.

Для формирования осей необходимо воспользоваться следующей конструкцией:

*ОСЬ*::*УЗЕЛ*[*Условия поиска*]

Основными осями являются:

1. parent - к родителю

2. ancestor - к предкам

3. ancestor-or-self - к предкам, включая текущий

4. child - к непосредственному потомку

5. descendant - ко всем потомкам

6. following - братские элементы (того же уровня справа), включая потомков

7. following-sibling - братские элементы (того же уровня справа)

8. preceding - выше текущего, включая потомков

9. preceding-sibling братские элементы (того же уровня слева)

Для отображения движения за текущий элемент возьмем DIV ID=B1

Parent

Движение происходит к непосредственному родителю текущего узла

Составим запрос:

//div[@id='B1']/parent::body

В итоге получим родительский узел "BODY"

Ancestor

Движение происходит не только к родительскому, но к более верхне-уровневым узлам-прародителям

Составим запрос

//div[@id='B1']/ancestor::html

По результатам данного запроса получим корневой узел "HTML"

Ancestor-or-self

Работает так же, как и предыдущая ось "ancestor". Разница заключается в том, что также захватывает и текущий узел

Составим запрос:

//div[@id='B1']/ancestor::*

Для большей наглядности выберем все узлы с помощью символа '*'. В результате получаем следующие узлы: