위키피디아에서 조사한 데이터를 이메일로 보내기
이번 과제는 주요 역사적 사건의 날짜 정보를 위키피디아에서 크롤링한 후, 역사적 사건과 날짜 정보를 담은 CSV 파일을 이메일로 첨부해 전송하는 것입니다.
이와 같은 프로그램이 작동하는 원리를 이해하면 대규모의 데이터를 크롤링하고, 이를 다양한 형태로 가공하여 이메일 전달하도록 활용 사례를 넓힐 수 있습니다.
크롤링 결과 CSV로 변환하기
먼저 크롤링한 결과를 CSV로 변환하는 과정을 살펴보겠습니다.
1. 필요한 라이브러리 불러오기
정적 웹 크롤링을 위한 라이브러리 가져오기
import pandas as pd
import requests
from bs4 import BeautifulSoup
-
pandas : 데이터를 읽고 처리하는 데 사용하는 라이브러리입니다. 주로
엑셀및CSV파일을 다룹니다. -
requests : 웹 페이지에
요청을 보내고응답을 받기 위해 사용하는 라이브러리입니다. -
BeautifulSoup : 웹 페이지의
HTML 코드를 분석하고 원하는 정보를 추출하는 라이브러리입니다.