위키피디아에서 조사한 데이터를 이메일로 보내기
이번 과제는 주요 역사적 사건
의 날짜 정보를 위키피디아
에서 크롤링한 후, 역사적 사건과 날짜 정보를 담은 CSV 파일
을 이메일로 첨부해 전송하는 것입니다.
이와 같은 프로그램이 작동하는 원리를 이해하면 대규모의 데이터를 크롤링하고, 이를 다양한 형태로 가공하여 이메일 전달하도록 활용 사례를 넓힐 수 있습니다.
크롤링 결과 CSV로 변환하기
먼저 크롤링한 결과를 CSV
로 변환하는 과정을 살펴보겠습니다.
1. 필요한 라이브러리 불러오기
정적 웹 크롤링을 위한 라이브러리 가져오기
import pandas as pd
import requests
from bs4 import BeautifulSoup
-
pandas : 데이터를 읽고 처리하는 데 사용하는 라이브러리입니다. 주로
엑셀
및CSV
파일을 다룹니다. -
requests : 웹 페이지에
요청
을 보내고응답
을 받기 위해 사용하는 라이브러리입니다. -
BeautifulSoup : 웹 페이지의
HTML 코드
를 분석하고 원하는 정보를 추출하는 라이브러리입니다.