HTML(또는 html5)을 Tree 구조로 파싱하는 방법이 있을까요

 

DOM을 사용할라하니 </ > 종료 태그가 없는게 걸러지지가 않아서 못하겠고

 

제리코같은 파서들은 특정 파서들을 쭈욱 뽑아내는거라서 트리구조로 형성을 하기가 힘들더군요;;

 

전체 HTML 구조를 tree 구조로 구조화해서 분석하려고 합니다. 고수님들 부탁드려요