본문으로 건너뛰기
실습하기

열과 행 선택

데이터를 분석할 때는 관심 있는 열만 고르거나, 일부 행만 확인하는 등 특정 부분에 집중해야 할 때가 많습니다.

판다스에서는 열 레이블, 행 위치, 인덱스 레이블을 사용해 이를 수행할 수 있습니다.


열 선택하기

열을 선택하는 가장 확실한 방법은 대괄호 안에 열 이름을 넣는 방식입니다.

열 이름으로 선택
data = {
"country": ["대한민국", "일본", "중국"],
"population": [52, 125, 1420]
}
df = pd.DataFrame(data)

df["population"]

이 코드는 Series객체를 반환합니다. 이 결과를 변수에 저장해 활용하거나, 조건문과 결합하거나, 계산에 직접 사용할 수도 있습니다.

참고: df.ColumnName처럼 점 표기법을 사용하는 방법도 있지만, 열 이름이 유효한 파이썬 식별자일 때만 동작하므로 일반적으로는 권장하지 않습니다.


행 선택하기

Pandas에서 특정 행(Row)을 선택할 때는 두 가지 방법을 사용할 수 있습니다.

  • iloc[]: 위치(index) 기반으로 접근
  • loc[]: 레이블(label) 기반으로 접근
위치로 첫 번째 행 선택
df.iloc[0]
레이블 0인 행 선택
df.loc[0]

두 방법 모두 하나의 행을 Series 형태로 반환합니다.


특정 값 선택하기

아래와 같이 loc를 사용하면 행과 열을 결합해 특정 셀의 값을 선택할 수 있습니다.

단일 값 선택
df.loc[0, "population"]

위 코드는 "인구" 열에서 첫 번째 행(인덱스 0)에 해당하는 값을 가져옵니다.

즉, 표 형태의 데이터에서 특정 좌표에 있는 값을 직접 지정해 추출하는 방식입니다.

사용법은 다음과 같습니다.

  • df.loc[행_라벨, 열_이름] 형태로 사용
  • 행 레이블은 문자열이나 정수로 지정
  • 열 이름은 문자열로 지정

요약

선택자접근 방식예시
df["col"]열 이름 기준df["나이"]
df.iloc[i]위치 기반 행df.iloc[3]
df.loc[i]레이블 기반 행df.loc[3]
df.loc[i, "col"]df.loc[3, "나이"]

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!