Подскажите пожалуйста, как мне можно программно пропарсить html(напримеры страницу в википедии), чтобы я смог достать только основной текст. Без надписями под картинкой и прочего. Я пока нашел только один путь: библиотека jsoup и через нее выборочно по html-тегам, а потом теги просто убирать. Как-то не очень нравится, может есть другой путь? Спасибо
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ