import java.io.IOException;

import org.htmlcleaner.CleanerProperties;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.SimpleXmlSerializer;
import org.htmlcleaner.TagNode;
import org.htmlcleaner.XmlSerializer;


public class ParseTest {
 public static void main(String[] args) {
  HtmlCleaner cleaner = new HtmlCleaner();
  CleanerProperties props = cleaner.getProperties();

  props.setUseCdataForScriptAndStyle(true);
  props.setRecognizeUnicodeChars(true);
  props.setUseEmptyElementTags(true);
  props.setTranslateSpecialEntities(true);
  props.setBooleanAttributeValues("empty");

  TagNode node = null;
  try{
   node = cleaner.clean("http://203.246.80.150/domian/domian.asp");
   SimpleXmlSerializer xmlS = new SimpleXmlSerializer(props);
   xmlS.writeXmlToStream(node, System.out);
  }

  catch(IOException e1){

  }
 }
}
정말 기본적으로 xml확인을 하고자 위와 같이 짯는데 위에 주소는 보시다 싶이 asp입니다.

해당 사이트 유형은 HTML이라고 되어있는데 위와 같은 소스 실행하면 그냥 콘솔창에


<?xml version="1.0" encoding="MS949"?>
<html><head /><body>http://203.246.80.150/domian/domian</body></html>

이것만 뜨네요. 이럴경우 어떻게 해야할지 정말 난감하네요;;