파싱은 잘못된 표현이며 크롤링, 스크래핑등이 맞는 표현입니다.
아하 홈페이지를 방문했을때 화면에 보여지듯, HTML문서는 DOM이라는(Document Object Model)형태의 뿌리를 내립니다.
이러한 DOM형태를 프로그래머가 분석하여 블로그 글을 긁어오거나, 단순히 HTML문서의 구성을 확인하여 블로그 글을 긁을수도 있습니다.
말씀하신 복사방지는 Javascript로 사용자가 브라우저로 접속할때에만 막혀있는것이며, 원본 소스를 들여보는 크롤링 형태에는 막히지 않습니다. (이와 별개로 크롤링을 막는 형태의 복사방지도 존재합니다)
이런 크롤링을 하는 방법은 언어/라이브러리 혹은 이러한 크롤링만 목적으로 하는 프로그램등 내가 해보려는 형태에 따릅니다.
우선 본인이 쉽게 해볼 수 있는 프로그래밍 언어(주로 파이썬이 대표적입니다) 및 강좌에 대해서 검색하여 배우시는걸 추천드립니다.