본문 바로가기
DB (DataBase) (국비)/DB 메모

자바에서 웹 크롤링 해보기

by Hwanii_ 2023. 5. 31.
728x90

자바로 웹 크롤링을 해보기

 

라이브러리 ?

 

1. 자바 코드 묶음 (.jar)

2. 미리 구현한 코드를 제공하는 파일.

3. 라이브러리 분석 XXX

(이미 완벽한 코드를 배포한 것이기 때문에 굳이 분석할 이유가 없다 !)

따라서, 라이브러리를 잘 활용하는것에 포커스를 맞춰야 한다.

 

4. Jsoup 클래스는 자동 import 불가능 하다.

자바에서 기본 제공 하는 클래스가 아니기 때문 이다.

따라서 라이브러리를 추가 해야 한다.

https://jsoup.org/download 에서 다운로드가 가능하다. (.jar 파일)

외부의 jar 추가를 하면 자동 import가 가능해진다.

 

 

 

 

 

 

 

 

 

[ Console ]

indexOf 메서드랑

substring 메서드랑

조건에 맞게 사용해서,

아래와 같이 원하는 값만 구해낼 수 있다.

 

 

짚고 넘어가야할 부분 :

 

substring() 는 인자가 1개짜리랑, 2개짜리가 있다.

 

1개짜리는 인덱스 기준으로 앞을 전부 날리고,

2개짜리는 n번째 (지금은 0번째) 기준부터 두번째 인자의 자리의 인덱스 앞 사이만 가지고 온다.

즉, 두번째 인자가 의미하는 인덱스 위치의 뒤는 전부 날라가는것 이다.

 

 

공부 해야 할 부분 :

 

indexOf 메서드

substring 메서드

반응형

'DB (DataBase) (국비) > DB 메모' 카테고리의 다른 글

수업 메모  (2) 2023.06.10
next() 메서드  (0) 2023.06.09
JDBC 모듈화 관련 개념  (0) 2023.06.09
메모  (0) 2023.06.07
웹 크롤링 및 웹 브라우저의 개념 및 기타 정리  (2) 2023.05.31