본문으로 건너뛰기
실습하기

불리언 조건으로 필터링

데이터 분석에서는 판매액이 10만 원을 초과하거나 사용자가 대한민국에 거주하는 경우만 선택하는 등 특정 기준을 만족하는 행에 집중해야 할 때가 많습니다.

Pandas에서는 이를 불리언 조건으로 간단히 처리할 수 있습니다.


불리언 조건

각 행이 요구 조건을 만족하는지 확인하는 조건식을 작성합니다. 그 결과는 True 또는 False 값으로 이루어진 Series이며, Pandas는 이를 사용해 DataFrame을 필터링합니다.

예를 들어 "점수" 열의 값이 80보다 큰 행만 필터링하려면 아래와 같이 작성할 수 있습니다.

불리언 조건으로 필터링
df[df["점수"] > 80]

이 코드는 조건이 True인 행만 포함하는 새로운 DataFrame을 반환합니다.


불리언 조건의 유용성

필터링을 사용하면 다음과 같은 장점이 있습니다.

  • 중요한 데이터에 집중할 수 있습니다
  • 데이터셋의 하위 집합을 탐색할 수 있습니다
  • 시각화나 모델링을 위한 데이터를 준비할 수 있습니다

또한 논리 연산자 &(AND)와 |(OR)를 사용해 조건을 결합할 수 있습니다. 각 조건은 반드시 괄호로 감싸세요.

조건 결합
df[(df["나이"] > 30) & (df["국가"] == "대한민국")]

이는 두 조건이 모두 True인 행을 선택합니다.


요약

  • 불리언 필터링은 관심 있는 행을 분리하는 유용한 방법입니다.
  • 조건에는 >, <, ==, != 같은 비교 연산자를 사용합니다.
  • 여러 조건을 결합할 때는 &|를 사용하고, 각 조건을 괄호로 감쌉니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!