불리언 조건으로 필터링
데이터 분석에서는 판매액이 10만 원을 초과하거나 사용자가 대한민국에 거주하는 경우만 선택하는 등 특정 기준을 만족하는 행에 집중해야 할 때가 많습니다.
Pandas에서는 이를 불리언 조건
으로 간단히 처리할 수 있습니다.
불리언 조건
각 행이 요구 조건을 만족하는지 확인하는 조건식을 작성합니다. 그 결과는 True
또는 False
값으로 이루어진 Series
이며, Pandas는 이를 사용해 DataFrame을 필터링합니다.
예를 들어 "점수"
열의 값이 80
보다 큰 행만 필터링하려면 아래와 같이 작성할 수 있습니다.
불리언 조건으로 필터링
df[df["점수"] > 80]
이 코드는 조건이 True
인 행만 포함하는 새로운 DataFrame을 반환합니다.
불리언 조건의 유용성
필터링을 사용하면 다음과 같은 장점이 있습니다.
- 중요한 데이터에 집중할 수 있습니다
- 데이터셋의 하위 집합을 탐색할 수 있습니다
- 시각화나 모델링을 위한 데이터를 준비할 수 있습니다
또한 논리 연산자 &
(AND)와 |
(OR)를 사용해 조건을 결합할 수 있습니다. 각 조건은 반드시 괄호로 감싸세요.
조건 결합
df[(df["나이"] > 30) & (df["국가"] == "대한민국")]
이는 두 조건이 모두 True
인 행을 선택합니다.
요약
- 불리언 필터링은 관심 있는 행을 분리하는 유용한 방법입니다.
- 조건에는
>
,<
,==
,!=
같은 비교 연산자를 사용합니다. - 여러 조건을 결합할 때는
&
와|
를 사용하고, 각 조건을 괄호로 감쌉니다.
다음 내용이 궁금하다면?
코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!