일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 유데미
- HTTP
- 오류
- Endpoint
- Game
- 파이썬
- 쉬티
- 웹크롤링
- API
- 상태코드
- 게임
- Tequila
- 프로그램
- Python
- twilio
- HTML
- 최저가
- 파싱
- SMTP
- ndarray
- API플랫폼
- 프로젝트
- 계산기
- Sheety
- udemy
- 웹페이지
- phython
- Pygame
- class
- 부트스트랩
Archives
- Today
- Total
데이터 분석가
웹 크롤링과 파싱(parsing) 본문
안녕하세요
웹 크롤링은
인터넷 상에 존재하는 다양한 웹 사이트에서 원하는 정보를 수집하는 기술이다
컴퓨터 프로그램을 이용해 자동화된 방식으로 정보를 수집하는데, 이는 웹 사이트의 HTML 코드를 가져와
원하는 정보를 추출한다.
예를 들어, 온라인 마케팅 업체에서 경쟁 업체의 정보를 수집, 인터넷 사용자 검색 키워드 분석하여 서비스,
제품 개발에 사용된다.
파싱(Parsing)은
일련의 문자열 데이터를 의미 있는 정보로 분해 해석하는 과정.
웹 사이트 상의 원하는 정보를 얻기 위해서 HTML 코드를 이용하는데, 파싱이 이용된다.
BeautifulSoup 모듈은 파싱을 수행하는 라이브러리 중 하나인데, HTML 문서의 태그, 속성, 값 등을
쉽게 추출하도록 도와준다
'파이썬(python) 기초' 카테고리의 다른 글
파이썬 np.arange를 통한 이미지 조작 (0) | 2023.05.30 |
---|---|
파이썬 ndarray 사용법 (0) | 2023.05.29 |
파이썬 requests 모듈로 HTTP 메소드(GET,POST,PUT 등) (0) | 2023.04.05 |
API와 END POINT(Feat.URL)의 개념 (0) | 2023.04.05 |
파이썬 클래스 활용 (0) | 2023.03.29 |
Comments