JAVA 자료구조 jsoup 사용하기

2017.03.27 15:24

졸리운_곰 조회 수:116

jsoup 사용하기

파이썬에 BeautifulSoup가 있고, C#에 HtmlAgilityPack이 있다면, 자바에는 Jsoup이 html 파싱에 가장 편할 것 같다.

(이름도 beautifulSoup와 비슷하게 jsoup임)

 

사용 방법부터 보자면, 우선 jsoup 라이브러리부터 가져와야 한다.

해당 홈페이지에서 다운 받거나, gradle을 이용해서 라이브러리를 추가하도록 한다.

 

dependencies{

     compile 'org.jsoup:jsoup:1.7.3'

}  

 

라이브러리 추가가 완료되었으면 이제 실제 어떻게 사용되는지를 확인해 보자.

 

웹 페이지의 GET 데이터 정보 가져오기

 

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.parser.Parser;

import org.jsou.select.Elements;

 

public class Test{

    public void getDataFromWeb(){

        Document doc = Jsoup.connect("웹데이터를 가져올 주소").get();

        ......

    }

 

웹 페이지의 POST 데이터 정보 가져오기

경축! 아무것도 안하여 에스천사게임즈가 새로운 모습으로 재오픈 하였습니다.
어린이용이며, 설치가 필요없는 브라우저 게임입니다.
https://s1004games.com

 

Document doc = Jsoup.connect("웹데이터를 가져올 주소").data("value1", "1").data("value2", "2").userAgent("Mozilla").cookie("auth", "token").timeout(3000).post(); 

 

웹 페이지의 XML 데이터 정보 가져오기

- XML 같은 경우에는 Jsoup 내부의 parser를 이용해야 한다.

 

Document doc = Jsoup.parse(new URL("웹데이터 주소").openStream(), "euc-kr", "웹데이터 주소");

Elements datas = doc.select("xml 노드");

for(i = 0; i < datas.size(); i++){

    System.out.println(String.valueOf(datas.get(i).attr("xml 각 노드의 속성"))); 

}

 

파싱하기

 

# class 명이 test인 항목만 가져와라

Elements items = doc.select(".test");

 

# id 명이 test인 항목만 가져와라

Elements items = doc.select("#test");

 

# class 명이 test인 항목 안의 a 태그만 가져와라

Elements tags = doc.select(".test a");

 



출처: http://yujuwon.tistory.com/entry/jsoup-사용하기 [Ju Factory]

 

 

본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
번호 제목 글쓴이 날짜 조회 수
204 스프링(Spring) 프레임워크 기본 개념 강좌 (6) - Dynamic Proxy 졸리운_곰 2017.10.02 71
203 스프링(Spring) 프레임워크 기본 개념 강좌 (5) - AOP Proxy file 졸리운_곰 2017.10.02 158
202 스프링(Spring) 프레임워크 기본 개념 강좌 (4) - AOP file 졸리운_곰 2017.10.02 109
201 스프링(Spring) 프레임워크 기본 개념 강좌 (3) - IoC file 졸리운_곰 2017.10.02 114
200 스프링(Spring) 프레임워크 기본 개념 강좌 (2) - 주요 구성 요소 & DI file 졸리운_곰 2017.10.02 107
199 스프링(Spring) 프레임워크 기본 개념 강좌 (1) - 스프링 이해하기 file 졸리운_곰 2017.10.02 290
198 Spring - IoC & DI file 졸리운_곰 2017.10.02 64
197 WebDAV 구현을 위한 환경 설정 file 졸리운_곰 2017.09.24 74
196 [subclipse] svn에서 무시할 파일 설정하기 svn:ignore property 설정 file 졸리운_곰 2017.09.24 145
195 다섯개의 탑 자바로 머신러닝 라이브러리 Top 5 machine learning libraries for Java file 졸리운_곰 2017.08.22 161
194 이진 파일, 이진 모드로 열어서 읽기 예제 소스 졸리운_곰 2017.05.20 135
193 Converting C# code in JAVA / datatype problem 졸리운_곰 2017.05.20 219
192 DwgFile.java - Joinup 졸리운_곰 2017.04.27 729
191 자바에서 C# 호출하기 file 졸리운_곰 2017.04.26 236
190 java4autocad Java for Autocad file 졸리운_곰 2017.04.26 257
189 Comparison between C# and Java - DiVA.pdf file 졸리운_곰 2017.04.25 682
188 [Java] Apache Commons HttpClient로 SSL 통신하기 졸리운_곰 2017.03.27 545
» jsoup 사용하기 졸리운_곰 2017.03.27 116
186 Java Annotation: 인터페이스 강요로부터 자유를… file 졸리운_곰 2017.03.20 77
185 JSoup를 이용한 HTML 파싱 졸리운_곰 2017.03.04 100
대표 김성준 주소 : 경기 용인 분당수지 U타워 등록번호 : 142-07-27414
통신판매업 신고 : 제2012-용인수지-0185호 출판업 신고 : 수지구청 제 123호 개인정보보호최고책임자 : 김성준 sjkim70@stechstar.com
대표전화 : 010-4589-2193 [fax] 02-6280-1294 COPYRIGHT(C) stechstar.com ALL RIGHTS RESERVED