htmlcleaner를 사용하여 html 문서를 파싱하려고 하는데요
html 문장형식은
<p>
<from>
</from>
안녕하세요.<br/>
저는 저입니다.<br/>
</p>
위와 같습니다.
여기에서 '안녕하세요' '저는 저입니다.' 를 파싱하려고 합니다
try {
URL text = new URL("");
HtmlCleaner cleaner = new HtmlCleaner();
InputStream in = text.openStream();
TagNode node = cleaner.clean(in, "euc-kr");
Object[] objArray = node.evaluateXPath("//p"); <==== 이부분을 건드려 줘야하는데 어떻게 건드려야할지
감이 안잡힙니다.
for (Object obj : objArray) {
TagNode t = (TagNode) obj;
String str_temp = t.getText().toString();
where.add(str_temp);
Log.i("Net", str_temp);
}
} catch (Exception e) {
Log.e("parsing", "parsing error", e);
}
}
----------------------------------------------------------------
도와주세요 ㅠㅠ