날짜와 시간 열 다루기
실제 데이터셋에는 판매 기록, 센서 데이터, 사용자 활동 로그처럼 날짜와 시간 정보(timestamp)
가 포함된 경우가 많습니다.
Pandas
를 사용하면 문자열을 datetime
객체로 변환하고 날짜 구성 요소를 쉽게 추출하며 특정 기간으로 데이터를 필터링할 수 있습니다.
문자열을 datetime으로 변환
날짜 데이터를 다루려면 우선 문자열을 datetime
객체로 변환해야 합니다.
열을 datetime으로 변환
df["date"] = pd.to_datetime(df["date"])
변환 후에는 Pandas가 해당 열을 실제 날짜형 데이터로 인식하므로 정렬, 기간 필터링 같은 작업을 손쉽게 수행할 수 있습니다.
날짜 구성 요소 추출
변환된 datetime 열에서는 연도, 월, 일, 시각 등 필요한 정보를 간단히 꺼낼 수 있습니다.
날짜 구성 요소 접근
df["연도"] = df["날짜"].dt.year
df["요일"] = df["날짜"].dt.day_name()
시간 기반 필터링
특정 기간에 해당하는 행만 선택하려면 불리언 마스킹을 활용할 수 있습니다.
특정 날짜 이후로 필터링
df[df["날짜"] > "2023-01-01"]
이렇게 하면 기간별 분석, 계절성 패턴 탐색, 이벤트 전후 비교 같은 다양한 시계열 분석 작업을 쉽게 처리할 수 있습니다.
다음 내용이 궁금하다면?
코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!