크롤링 4

Django 실습(1) 핫딜 크롤링해서 상품 사이트 만들기

https://userdonghu.tistory.com/entry/Django-%ED%8A%9C%ED%86%A0%EB%A6%AC%EC%96%BC Django 튜토리얼 Python 설치 이후. Django 프로젝트 파일 열기. mkdir mysite 로 폴더 만들고 cd mysite로 이동하기. python -m venv venv # 가상환경 설정. 뒤가 이름 source ./venv/bin/activate # 가상환경 실행 pip install django # 장고 설 userdonghu.tistory.com Django 튜토리얼을 통해서 mysite 폴더 안에 가상환경을 구성하고 django 설치, startproject, runserver까지 하기. python manage.py startapp 으로..

Django 2023.10.05

Python 실습 - 셀레니움으로 크롤링(이었던것)

파이썬 처음 공부할 때 셀레니움으로 크롤링 했던것을 다시 한번 살펴보자 혼자 열심히 구글과 고군분투해서 뿌듯했던 기억이 있다. 물론 지금 보면 코드가 맘에 안든다. 핫딜 게시판을 크롤링해서 csv파일에 중복된 항목이 나올 때 까지 페이지를 넘겨가며 csv파일에 저장하는 방식이다. 모듈 import 많은 import들.. 셀레니움은 크롬드라이버가 계속 속을 썩여서 BeautifulSoup이 더 편한것 같다.. from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.chrome.service import Service from selenium.webdriver.support.ui impo..

Python 2023.09.24

Python 실습 - 핫딜 크롤링 해보기

원래 목표는 핫딜 게시판을 크롤링하는 py파일을 만들어서 그걸 매 시간 정각마다 실행되도록 외부 서버를 이용한 후, 만약 새 글이 올라왔으면 나에게 알림을 보내는 것이었지만 아직 그렇게 까지 하기에는 실력이 부족하기도하고 귀찮기도해서 일단 크롤링만 해보았다. 예전에는 셀레니움으로 했었는데 이번엔 BeautifulSoup으로 해봄. 모듈 import from bs4 import BeautifulSoup import requests import re 내가 검색하고싶은 키워드 정하고 url입력한 후, 잘 응답했는지 확인 난 애플워치 스테인리스를 싸게 사고싶으니까 애플워치로 함 mykeyword = '애플워치' # 검색하고싶은 키워드 res = requests.get(f'https://www.fmkorea.co..

Python 2023.09.24

Python(20) BeautifulSoup 크롤링

예전에 bs4랑 Selenium이랑 이미 한번 공부하고 핫딜 사이트 크롤링해서 csv파일로 카테고리별로 나눠서 저장해오는 코드도 연습했었는데 크롬 드라이버 에러 때문에 실행이 안된다.. 자동으로 크롬 버전에 맞는 드라이버 설치해서 돌리는 코드였는데 아직 드라이버는 업데이트가 안되어서 그런듯? 이 부분은 나중에 다시 공부해서 고치는걸로. 기본 세팅 import requests from bs4 import BeautifulSoup response = requests.get('사이트url') # GET방식으로 HTTP요청 # params = {'pa1': 'val1', 'pa2': 'value2'} # response = requests.get('사이트url', params=params) # print(res..

Python 2023.09.22