아버지께서 알바를 맡기셨다. 엑셀 명단에 있는 회사들의 주소를 인터넷에서 찾고, 만약 그 회사의 주소지가 서울이면 전화번호를 다음 열에다가 입력하는 알바이다. 회사가 300개 정도라고 알고 있었는데 파일을 열어보니 600개에 도달했다. 쓰고 보니까 약간 수학문제집 말투인데 아니다 진짜 알바다.. 한 140개까지 하고 빡종했다. Python으로 자동화된 코드를 만들어 볼 순 없을까 하며 Beautiful Soup하고 Selenium을 설치하였다. 두개 다 오픈소스이다.
간단히 설명하자면,
Beautiful Soup은 html과 xml 문서를 파싱하기 위한 패키지로, html에서 데이터를 추출하는 데 유용한 구문 분석 트리를 생성한다.
Selenium은 웹 브라우저를 이용하여 웹 사이트에서 자동적으로 제어를 할 수 있게 하는 도구이다.
VS code 터미널창에
pip install --upgrade pip
로 pip 업데이트를 한번 해주고,
pip install selenium
이라고 치면 셀레니움은 5초? 만에 설치가 되었다.
bs4도 코드 한줄만 입력하면 끝이다.
pip install bs4
'Python' 카테고리의 다른 글
[Python] 경사도 자동 크롤링 코드 (0) | 2023.07.24 |
---|---|
[Python] Pandas에서 파일 데이터 조작 (0) | 2023.07.13 |
[Python] VS Code 인터프리터 바꾸는 법 (아나콘다가 VS code에서 자꾸 실행될 때) (0) | 2023.07.07 |
[Python] 모듈 datetime 및 pandas에서의 시계열 처리 (0) | 2023.07.05 |
[Python] Class 총정리 (0) | 2023.03.06 |