자 우선 Jsoup 라이브러리를 프로젝트에 추가 시켜야 겠지요? Jsoup 라이브러리 다운로드 / 이클립스 라이브러리 추가 방법 제가 걸어놓은 링크로 들어가서 다운받고 따라해보세요! 그러면 준비가 다 되었다면 포켓몬 마스터 페이지의 웹 파싱을 해보겠습니다! html 소스를 보니까 포켓몬 하나에 대한 정보가 하나의 태그로 묶이는것을 볼수 있습니다. 그럼 이것을 이용해볼까요? 출력해봅시다! 잘 나오는듯 합니다.. 하지만 소스 마지막에 태그가 또 들어갔나봅니다. 뭐 이렇게 짜서 편집잘하면 저 문제를 풀수는 있을겁니다. 하지만 우리의 목표는 이게 아니지요? 자 포켓몬 만의 특별한 데이터가 있는지 봅니다! 1#009BlastoiseWatercs 클래스가 "infocard-tall " 이군요! 위 소스에서 1Ele..
※포켓몬스터를 좋은 예제로써 사용할뿐 개인 취향과의 관련이 있는것은 아님을 밝힘니다. 자! 파싱을 모르는 분들이 찾아들어오시진 않았을테니 자세한 설명은 하지않겠습니다. 논문을 제작하는 과정에서 웹의 내용을 긁어 와야 하는 작업이 필요해졌습니다! 그래서 가장 처음엔 다음과 같이 구현하였지요. 이것을 이용하면 HTML 형식의 올라가 있는 데이터를 가져오는것이 아니라 해당 페이지의 html을 전부 긁어 오게 됩니다. 그래서 사실 이것은 웹 파싱이라고 할 수 없죠. 이 방법을 쓰면 엔터를 위한 태그부터 심지어 인코딩도 안맞아 한글도 깨지게 됩니다. 그러면 웹에 뜬 그대로를 받아오는 방법은 없는 것일까요? 없다면.. 제가 포스팅을 ..