Парсить html

Подскажите пожалуйста, как мне можно программно пропарсить html(напримеры страницу в википедии), чтобы я смог достать только основной текст. Без надписями под картинкой и прочего. Я пока нашел только один путь: библиотека jsoup и через нее выборочно по html-тегам, а потом теги просто убирать. Как-то не очень нравится, может есть другой путь? Спасибо

Комментарии (4)

ЧТОБЫ ПОСМОТРЕТЬ ВСЕ КОММЕНТАРИИ ИЛИ ОСТАВИТЬ КОММЕНТАРИЙ,
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ

Diana Уровень 41

21 июля 2015

На 28 уровне изучается фреймворк jsoup. Он отлично подходит к решению данного вопроса

Fry Уровень 41

20 июля 2015

developer.alexanderklimov.ru/android/library/jsoup.php