Скребок HTML с Javascript

Я использую простой скрипт javascript в пакетном файле для загрузки аудио и видео - радио и телевизионных шоу - из iPlayer BBC.

Часть скрипта извлекает данные из XML-страниц BBC.

Теперь я хочу попробовать извлечь данные с html-страницы. Может ли кто-нибудь указать мне на метод javascript для извлечения данных с обычной страницы.htm или.html?

Я очень хочу, чтобы все было просто, с помощью javascript-подпрограммы, которую я могу включить в html-страницу на моем веб-сайте, поэтому меня интересуют только решения javascript. Благодарю.

Редактировать, 24 августа -

Страницы HTML html не отвечают на скрипты Javascript, которые успешно анализируют свои xml-страницы.

Я использую простой javascript для опроса xml, основываясь на этом -

function loadXML() {xmlDoc = новый ActiveXObject ("Microsoft.XMLDOM"); xmlDoc.async = false; xmlDoc.async = false;xmlDoc.onreadystatechange = readXML; xmlDoc.onreadystatechange = readXML;xmlDoc.load(url); xmlDoc.load(URL);} }

1 ответ

Ваш вопрос нечеткий. Я думаю, что может быть два способа сделать это: 1. применить RegExp для сопоставления шаблонов. 2. импортировать html в симулятор dom и пройти дерево, чтобы найти данные (предположим, вы используете nodejs)

licensed under cc by-sa 3.0 with attribution.