간단한 정규식 이용하세요. Pattern ptn = Pattern.compile("<td.*?>(.+?)<\\/td>", Pattern.CASE_INSENSITIVE + Pattern.DOTALL); Matcher mch = ptn.matcher(html); while (mch.find()) { String tdBody;
tdBody = mch.group(1); }
의 형식입니다. 오타 오류 있을수 있습니다.
정규식으로 <td 어떤 문자>모든문자</td>를 검출하게 하고 모든 문자 부분을 group 1로 검출하여 tdBody에 저장 하는 식입니다. 저장후 tdBody를 줄바꿈 문자를 기준으로 split 하시어 줄단위로 짤라내시면 원하시는 결과 나오겠네요. 자주 사용하는 곳이라면 pattern을 매번 컴파일 하지 않게 클래스 정적 변수로 선언해 두시면 좀더 좋겠습니다.
Pattern ptn = Pattern.compile("<td.*?>(.+?)<\\/td>", Pattern.CASE_INSENSITIVE + Pattern.DOTALL);
Matcher mch = ptn.matcher(html);
while (mch.find()) {
String tdBody;
tdBody = mch.group(1);
}
의 형식입니다.
오타 오류 있을수 있습니다.
정규식으로 <td 어떤 문자>모든문자</td>를 검출하게 하고 모든 문자 부분을 group 1로 검출하여 tdBody에 저장 하는 식입니다.
저장후 tdBody를 줄바꿈 문자를 기준으로 split 하시어 줄단위로 짤라내시면 원하시는 결과 나오겠네요.
자주 사용하는 곳이라면 pattern을 매번 컴파일 하지 않게 클래스 정적 변수로 선언해 두시면 좀더 좋겠습니다.