Shkiper
27 уровень
Гомель

Парсить html

Статья из группы Архив info.javarush
Подскажите пожалуйста, как мне можно программно пропарсить html(напримеры страницу в википедии), чтобы я смог достать только основной текст. Без надписями под картинкой и прочего. Я пока нашел только один путь: библиотека jsoup и через нее выборочно по html-тегам, а потом теги просто убирать. Как-то не очень нравится, может есть другой путь? Спасибо
Комментарии (4)
ЧТОБЫ ПОСМОТРЕТЬ ВСЕ КОММЕНТАРИИ ИЛИ ОСТАВИТЬ КОММЕНТАРИЙ,
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ
Diana Уровень 41
21 июля 2015
На 28 уровне изучается фреймворк jsoup. Он отлично подходит к решению данного вопроса