본문으로 건너뛰기
실습하기

데이터 유형: 구조화 vs 비정형

모든 데이터가 동일한 형태를 띠는 것은 아닙니다.

데이터의 형태에 따라 저장 방식, 처리 방법, 분석 전략이 크게 달라집니다.

데이터를 분석할 때 가장 먼저 던져야 할 질문은 바로 이것입니다.

지금 내가 다루고 있는 데이터는 어떤 유형인가?

데이터는 크게 두 가지 범주로 나눌 수 있습니다.

  • 구조화 데이터(Structured Data): 일정한 형식과 규칙을 따르는 데이터로, 정렬·검색·분석이 쉽습니다.
  • 비정형 데이터(Unstructured Data): 자유로운 형태를 가진 데이터로, 의미를 이해하려면 맥락을 고려한 추가 처리가 필요합니다.

각 유형에 따라 사용하는 도구, 저장 시스템, 분석 기법도 달라집니다.


데이터 분석가의 핵심 질문

데이터 분석을 시작하기 전, 다음과 같은 질문을 스스로에게 던져야 합니다.

  • 데이터를 저장하거나 조회하기에 가장 적합한 형식은 무엇인가?
  • 분석 전에 필요한 정제(Cleaning) 과정은 얼마나 복잡한가?
  • 데이터의 구조에 맞는 도구와 라이브러리는 무엇인가?

내가 다루는 데이터가 구조화인지 비정형인지 파악하면, 올바른 전략을 세우고 불필요한 시행착오를 줄일 수 있습니다.

슬라이드를 통해 각 데이터 유형의 특징과 실제 사례를 살펴보겠습니다.