Pandas로 데이터 다루기
Pandas로 데이터프레임의 특정 열을 선택하고, 조건에 맞는 행을 필터링하고, 데이터를 정렬할 수 있습니다.
데이터 조작 예시
import pandas as pd
data_frame = pd.DataFrame({
'품목': ['사과', '바나나', '딸기', '포도'],
'매출': [1000, 2000, 1500, 3000]
})
# 특정 열 선택
sales = data_frame['매출']
print("sales:", sales)
# 조건에 맞는 행 필터링
filtered_data = data_frame[data_frame['매출'] > 1500]
print("filtered_data:", filtered_data)
# 데이터 정렬
sorted_data = data_frame.sort_values(by='매출', ascending=False)
print("sorted_data:", sorted_data)
sales = data_frame['매출']
코드는 데이터프레임에서 '매출' 열만 선택하여 시리즈로 반환합니다.
print(sales) 출력 결과
0 1000
1 2000
2 1500
3 3000
Name: 매출, dtype: int64
filtered_data = data_frame[data_frame['매출'] > 1500]
코드는 '매출' 열의 값이 1500보다 큰 행만 필터링하여 새로운 데이터프레임을 생성합니다.
print(filtered_data) 출력 결과
품목 매출
1 바나나 2000
3 포도 3000
sorted_data = data_frame.sort_values(by='매출', ascending=False)
코드는 '매출' 열을 기준으로 내림차순 정렬한 데이터프레임을 반환합니다.
print(sorted_data) 출력 결과
품목 매출
3 포도 3000
1 바나나 2000
2 딸기 1500
0 사과 1000
최대, 최소, 평균값 계산하기
Pandas로 데이터프레임의 최대값, 최소값, 평균값을 계산할 수 있습니다.
최대, 최소, 평균값 계산
import pandas as pd
data_frame = pd.DataFrame({
'품목': ['사과', '바나나', '딸기', '포도'],
'매출': [1000, 2000, 1500, 3000]
})
# 최대값
max_sales = data_frame['매출'].max()
# 최대값: 3000 출력
print(f'최대값: {max_sales}')
# 최소값
min_sales = data_frame['매출'].min()
# 최소값: 1000 출력
print(f'최소값: {min_sales}')
# 평균값
mean_sales = data_frame['매출'].mean()
# 평균값: 1875.0 출력
print(f'평균값: {mean_sales}')
다음 내용이 궁금하다면?
코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!