HTML 문서를 EUC-KR로 저장하려는 데 이상한 문자가 삽입됩니다.

anpub

https://www.androidpub.com/android_dev_qna/958345

2010.11.05 23:06:29

5243

final WebClient wc = new WebClient();
HtmlPage page = wc.getPage("한글로 된 웹 URL");
  File f = new File("test.htm");
  f.delete();
  OutputStreamWriter out = new OutputStreamWriter(new FileOutputStream(f),"euc-kr");
  out.write(page.asXml());
  out.close();

HtmlUnit란 라이브러리가 있습니다.
HTML파서와 자바스크립트 인터프리터가 합쳐진 라이브러리입니다.
여기서 EUC-KR 한글로 된 웹 문서를 읽어옵니다.
그런데 이 라이브러리는 저절로 EUC-KR을 UTF-8로 변환시킵니다.
즉 page.asXML에는 UTF-8이 들어있습니다.
이게 FileOutputStream을 거치면서 euc-kr로 바뀌고 파일로 저장되는 구조입니다.
그런데 원본에는 없는 공백 부분에 ?표가 삽입됩니다.
OutputStreamWriter out = new OutputStreamWriter(new FileOutputStream(f),"utf-8");
이렇게 utf-8로 저장하면 ?표 부분은 웹브라우저에서 그냥 공백으로 표시됩니다.
"              <div class="article_body">
                　
                <font color="#0000ff">"
그런데 이걸 euc-kr로 HEX에디터에서 변환하면 물음표가 생깁니다.
"              <div class="article_body">
                ? ?
                <font color="#0000ff">"
?표 부부의 HEX 코드는 다음과 같습니다.
"20 20 20 20 c2 a0 20 e3 80 80 0d 0a 20 20 20 20 20 20"
이런 글자가 생기는 부분은 원본 웹문서 위치를 보니까 ' '이게 있는 위치입니다.
이게 잘못 변환되는 거같습니다.
어떻게 해야 ?가 안생기게 저장할 수 있을까요?
라이브러리의 버그일까요?

이 게시물을

번호	분류	제목	글쓴이	날짜	추천	조회
공지	앱개발 질문	게시글 작성시 소스코드를 보기 쉽게 처리하기 33	멍멍대왕	01-21	5	712050
공지	앱개발 질문	[필독] Q&A 게시판 글작성 안내, 질문전 검색 필수! 176	회색	01-29	7	1189902
13772	기타 질문	애드센스 광고삽입하는 방법... 2	qhrrlxp	11-06		4142
13771	앱개발 질문	화면 구성에 관한 질문입니다 5	skylik	11-06		2743
13770	기타 질문	25MB 넘는 apk 는 어떻게 배포해요? 1	닝네임	11-06		3662
13769	앱개발 질문	시작하면 AlertDialog 뜨게.. 3	아이로이드 7	11-06		3438
13768	앱개발 질문	Service, Application 에서 생성된 객체의 접근 범위?	휘오른	11-06		3225
13767	기타 질문	t스토어 검증기간... 1	qhrrlxp	11-06		4322
13766	앱개발 질문	갤럭시s 속도문제 DB 관련 7	제눅스	11-06		3576
13765	앱개발 질문	안드로이드 홈 UI처럼 자유롭게 항목을 끌어 배치하고 정렬하거나 제거하고싶습니다. 2	컨트로이드	11-06		3290
13764	앱개발 질문	롱 홈키 눌렀을때 실행한 APP 안나오게 하기	미친나무	11-05		4316
	앱개발 질문	HTML 문서를 EUC-KR로 저장하려는 데 이상한 문자가 삽입됩니다.	anpub	11-05		5243
13762	앱개발 질문	array 배열로 이해해서 불러오는 방법에대해 여쭤보고싶습니다.	해골	11-05		2942
13761	앱개발 질문	안드로이드 2.2 에뮬레이터에서 OpenGL2.0을 지원하나요? 1	제이	11-05		4467
13760	앱개발 질문	안드로이드 게임 개발 2	크룬	11-05		3811
13759	앱개발 질문	getContentResolver통해 EXTERNAL_CONTENT_URI를 query할때, join 할수있나요? 3	yuie	11-05		4559
13758	앱개발 질문	변수에 따라 버튼 갯수를 늘리고 싶습니다. 2	BSH	11-05		3362
13757	플랫폼 질문	안드로이드 에서는 Device driver 라는 개념조차 없는가요? 7	안드로매다	11-05		8182
13756	앱개발 질문	아..죽겠습니다..inputStream().....처리문제.. 3	안드루	11-05		5152
13755	앱개발 질문	지도에 배치된 오버레이 표식(마크) 지도 확대 비율에 따라 크기 조절이 가능 할까요?	섭풍...	11-05		4084
13754	앱개발 질문	phone call 이벤트 받기 문제. 1	알라라	11-05		5013
13753	앱개발 질문	안녕하세요 URL 가져와서 파싱하는 부분에서 에러가 났습니다. 3	안드루	11-05		3791

쓰기

첫 페이지 1560 1561 1562 1563 1564 1565 1566 1567 1568 1569 끝 페이지

최근 인기글

개발자 질문/답변 게시판이 새로운 공간으로 이전되었습니다.