Shkiper
27 уровень

Парсить html

Статья из группы Архив info.javarush
участников
Подскажите пожалуйста, как мне можно программно пропарсить html(напримеры страницу в википедии), чтобы я смог достать только основной текст. Без надписями под картинкой и прочего. Я пока нашел только один путь: библиотека jsoup и через нее выборочно по html-тегам, а потом теги просто убирать. Как-то не очень нравится, может есть другой путь? Спасибо
Комментарии (4)
  • популярные
  • новые
  • старые
Для того, чтобы оставить комментарий Вы должны авторизоваться
Diana
Уровень 41
21 июля 2015, 11:06
На 28 уровне изучается фреймворк jsoup. Он отлично подходит к решению данного вопроса
Shkiper
Уровень 27
21 июля 2015, 13:36
Я сейчас немного другим занят, еще только на 20)
Fry
Уровень 41
20 июля 2015, 21:07
Shkiper
Уровень 27
21 июля 2015, 00:07
Да, спасибо, именно этой статьей и руководствовался