Python

[Python] Beautiful Soup 과 Selenium 설치하기

곽가누 2023. 4. 9. 00:01

아버지께서 알바를 맡기셨다. 엑셀 명단에 있는 회사들의 주소를 인터넷에서 찾고, 만약 그 회사의 주소지가 서울이면 전화번호를 다음 열에다가 입력하는 알바이다. 회사가 300개 정도라고 알고 있었는데 파일을 열어보니 600개에 도달했다. 쓰고 보니까 약간 수학문제집 말투인데 아니다 진짜 알바다.. 한 140개까지 하고 빡종했다. Python으로 자동화된 코드를 만들어 볼 순 없을까 하며 Beautiful Soup하고 Selenium을 설치하였다. 두개 다 오픈소스이다. 

 

간단히 설명하자면, 

Beautiful Soup은 html과 xml 문서를 파싱하기 위한 패키지로, html에서 데이터를 추출하는 데 유용한 구문 분석 트리를 생성한다. 

Selenium은 웹 브라우저를 이용하여 웹 사이트에서 자동적으로 제어를 할 수 있게 하는 도구이다. 

 

VS code 터미널창에

pip install --upgrade pip

로 pip 업데이트를 한번 해주고,

pip install selenium

이라고 치면 셀레니움은 5초? 만에 설치가 되었다. 

bs4도 코드 한줄만 입력하면 끝이다. 

pip install bs4