JavaRush/Java блог/Архив info.javarush/Парсить html

27 уровень

17.07.2015
1585просмотров
4комментариев

Парсить html

Статья из группы Архив info.javarush

участников

Подскажите пожалуйста, как мне можно программно пропарсить html(напримеры страницу в википедии), чтобы я смог достать только основной текст. Без надписями под картинкой и прочего. Я пока нашел только один путь: библиотека jsoup и через нее выборочно по html-тегам, а потом теги просто убирать. Как-то не очень нравится, может есть другой путь? Спасибо

Java-университет

Комментарии (4)

популярные
новые
старые

Для того, чтобы оставить комментарий Вы должны авторизоваться

Уровень 41

21 июля 2015, 11:06

На 28 уровне изучается фреймворк jsoup. Он отлично подходит к решению данного вопроса

0

Уровень 27

21 июля 2015, 13:36

Я сейчас немного другим занят, еще только на 20)

0

Уровень 41

20 июля 2015, 21:07

developer.alexanderklimov.ru/android/library/jsoup.php

0

Уровень 27

21 июля 2015, 00:07

Да, спасибо, именно этой статьей и руководствовался

0