html에서 내용만 추출하고 싶을때 사용하면 좋을 라이브러리입니다.

예를 들어 뉴스 관련 앱을 만들때, 기사에서 본문만 가져올수 있습니다.


https://code.google.com/p/boilerpipe/


문제는 안드로이드에서 바로 실행은 힘든것 같구요.

서버단에서 사용하시면 될 것 같습니다.