html로 된 홈피를 xml로 바꾸려합니다
구글링한 결과 나온 소스를 보면

public class HtmlToXml3 {
 
 public static void main(String[] arg) {
HtmlCleaner cleaner = new HtmlCleaner();
CleanerProperties props = cleaner.getProperties(); // cleaner의 속성을 정의하기 위한.. 변수 
TagNode node =null; // 트리에 결과를 저장하는건가?;
props.setOmitComments(true); // 주석 제거. 이런식으로 속성을 설정해줍니다. 
    
try {
node = cleaner.clean(new File("어쩌구저쩌구.html")); // 대상파일이나 URL 등을 넣어서 결과를 node 에 넣습니다. 
}catch(IOException e) {
   e.printStackTrace();
}
  
  //HtmlCleanerAPI로 clean 결과 출력하기 
   SimpleXmlSerializer se = new SimpleXmlSerializer(props);
   try {
   se.writeXmlToStream(node, System.out); // 그냥 화면으로 출력됩니다. 
   }catch(IOException e) {
   e.printStackTrace();
   }
  }
}

node부분에 들어간 .html 파일을 프로젝트 밑에 하나 생성을 하고 그냥 자바 어플리케이션으로 실행을 하면
# A fatal error has been detected by the Java Runtime Environment:
#
#  Internal Error (classFileParser.cpp:3161), pid=2024, tid=2828
#  Error: ShouldNotReachHere()
#
# JRE version: 6.0_21-b07
# Java VM: Java HotSpot(TM) Client VM (17.0-b17 mixed mode windows-x86 )
# An error report file with more information is saved as:
# D:\androiddata\KdsParsing3\hs_err_pid2024.log
#
# If you would like to submit a bug report, please visit:
#   http://java.sun.com/webapps/bugreport/crash.jsp
#

콘솔창에 이런창이 뜨더라구요
그리고 이렇게 하는게 맞는지 모르겠네요
파싱해오려는 사이트에 가서 소스보기 한다음 그걸 메모장에서 저장을했거든요...

오늘 밤을 새서라도 해야겠습니다...
많은 도움 부탁드립니다..