[JSP] HTTrack Website Copier Manual

What is Web Scraping?
　：Website에서 원하는 정보를 자동으로 수집하는 것

＊ 웹 크롤링이란?

　인터넷을 이용하다가 '아, 이 홈페이지 참 잘 만들었다. 어떻게 구성을 했는지 알아보고 싶다!' 하는 생각이 든다면, 웹 크롤링을 이용해서 소기의 목적을 달성할 수 있다. 웹 크롤링이란 내 컴퓨터가 인터넷이 되지 않아도 웹 사이트를 다운로드 받아서 구조를 살펴볼 수 있다. 필자는 Website를 통채로 자신의 컴퓨터에 다운로드할 수 있는 툴을 이용할 것이다.

　우리가 코드를 짜거나 분석할 때 IDE(통합 개발 환경)을 사용하는 것처럼, 웹 크롤링을 할 때에도 쉽게 환경을 제공해 주는 툴들이 존재한다. 우리는 그 중에서 HTTrack라는 툴을 이용하려고 한다. 추가로 HTTrack Website Copier 홈페이지 명세를 보면, 뒷부분에 free software offline browser(GNU GPL)라고 적혀있다. HTTrack은 한국어 지원을 하지 않기 때문에 간단하게 사용법까지 알아보도록 하자.

▷ HTTrack Website Copier - Free Software Offline Browser (GNU GPL)