import java.io.IOException;
import org.htmlcleaner.CleanerProperties;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.SimpleXmlSerializer;
import org.htmlcleaner.TagNode;
import org.htmlcleaner.XmlSerializer;
public class ParseTest {
public static void main(String[] args) {
HtmlCleaner cleaner = new HtmlCleaner();
CleanerProperties props = cleaner.getProperties();
props.setUseCdataForScriptAndStyle(true);
props.setRecognizeUnicodeChars(true);
props.setUseEmptyElementTags(true);
props.setTranslateSpecialEntities(true);
props.setBooleanAttributeValues("empty");
TagNode node = null;
try{
node = cleaner.clean("http://203.246.80.150/domian/domian.asp");
SimpleXmlSerializer xmlS = new SimpleXmlSerializer(props);
xmlS.writeXmlToStream(node, System.out);
}
catch(IOException e1){
}
}
}
정말 기본적으로 xml확인을 하고자 위와 같이 짯는데 위에 주소는 보시다 싶이 asp입니다.
해당 사이트 유형은 HTML이라고 되어있는데 위와 같은 소스 실행하면 그냥 콘솔창에
<?xml version="1.0" encoding="MS949"?>
<html><head /><body>http://203.246.80.150/domian/domian</body></html>
이것만 뜨네요. 이럴경우 어떻게 해야할지 정말 난감하네요;;