DataFrame 병합과 조인
실제 데이터 작업에서는 정보가 여러 테이블에 흩어져 있는 경우가 많습니다.
예를 들어,한 DataFrame에는 고객 정보가, 다른 DataFrame에는 해당 고객의 주문 정보가 들어 있을 수 있습니다.
이들을 함께 분석하려면 데이터셋을 merge
또는 join
으로 결합해야 합니다.
Merge와 Join의 기본
Pandas는 데이터를 결합하기 위한 유용한 메서드를 제공합니다.
pd.merge()
는 두 DataFrame에서 기준 열의 값이 일치하는 행을 기준으로 결합하며, SQL 조인과 유사하게 동작합니다..join()
은 인덱스 또는 키 열을 사용하여 한 DataFrame에 다른 DataFrame의 열을 추가하는 메서드입니다.
자주 쓰는 조인 유형
조인 유형 | 설명 |
---|---|
Inner | 일치하는 행만 유지 |
Left | 왼쪽 DataFrame의 모든 행을 유지하고, 오른쪽에서 일치하는 값을 가져옴 |
Right | 오른쪽 DataFrame의 모든 행을 유지하고, 왼쪽에서 일치하는 값을 가져옴 |
Outer | 두 DataFrame의 모든 행을 유지하며, 없는 값은 NaN으로 채움 |
이러한 조인을 통해 포함할 데이터의 범위를 제어하고, 엄격한 일치만 볼지 전체 결합을 할지 선택할 수 있습니다.
다음 내용이 궁금하다면?
코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!