PHP: Извлечение текста из строки между двумя конкретными тегами

Я собираю функцию быстрого извлечения в PHP. В основном, он будет читать содержимое данного URL-адреса и извлекать необходимый код HTML. Затем он помещает код в новую страницу. Теперь я все работаю, кроме одного.

У меня есть строка с содержимым URL-адреса, и теперь я хочу извлечь текст между двумя тегами. Скажем, я хочу начать копирование контента по определенному тегу. Это легко, так как эти теги имеют классы.

Таким образом, у меня была бы функция начинаться с "" Она просто ищет документ для всего текста, который соответствует этому. Однако я столкнулся с проблемой. В разделе, которое я хочу скопировать, есть другие теги. Таким образом, если я скажу функции прекратить извлечение на ",", скребок перестанет читать в конце случайного тега. Может кто-нибудь помочь мне написать немного PHP-кода, который гарантирует, что тег, который функция останавливается, является закрывающим тегом для "", а не для какого-либо случайного тега, который находится в строке?

Заранее спасибо.

1 ответ

Невозможно это сделать и учитывать все возможные содержания между тегами. Используйте XmlDocument и проанализируйте HTML.

licensed under cc by-sa 3.0 with attribution.