자바 네트워크 프로그래밍을 익히던 중 얼마전 xml DOM parser 를 알게 되었습니다.
인터넷으로 불러오는 xml 파일 형식은 DOM parser 를 이용하여 원하는대로 정보 확인이
되고 있습니다만... 혹시 이 parser 로 html 은 parsing 할 수 없는지 궁금합니다.
xml parser 로 html parsing 이 가능한지 여부와 가능하다면 어떤 식으로 구현하면 되는지
질문드립니다. :)
XML 파서는 말그대로 XML을 파싱하기 위해서 사용하는것입니다.
따로 HTML 파서를 사용하시는게 좋습니다만
XML 형태 자체가 <xml></xml> 인것처럼 html도 <html><body></body></html> 형식이라서 긁어오시는건 얼마든지 가능합니다.
다만 기본 파서 를 이용하여 자바에서 하시는것보다는 전문적인 크롤링 프로그램 등을 사용하시는게 더 효율성이 좋으니 이부분 참고 바랍니다