본문으로 건너뛰기
실습하기

데이터 유형: 정형 vs 비정형

데이터는 모두 같은 모습으로 존재하지 않습니다.

데이터의 형태에 따라 저장 방식, 처리 방법, 분석 전략까지 달라집니다.

데이터 분석을 시작할 때는 가장 먼저 어떠한 데이터를 다뤄야 하는지 파악해야 합니다.

데이터는 크게 두 가지로 나눌 수 있습니다.

정형 데이터(Structured Data)

  • 일정한 규칙과 형식을 따르는 데이터.
  • 데이터베이스에 저장하기 쉽고, 검색·정렬·분석이 용이합니다.

비정형 데이터(Unstructured Data)

  • 정해진 구조가 없는 데이터.
  • 텍스트, 이미지, 영상 등 의미를 이해하려면 맥락을 고려한 추가 처리가 필요합니다.

데이터 유형에 따라 활용하는 도구, 저장 방식, 분석 기법 모두 달라집니다.


분석 전에 던져야 할 질문들

데이터 분석을 시작하기 전에 다음과 같은 부분을 먼저 살펴봐야 합니다.

  • 이 데이터를 저장하거나 조회하기에 가장 적합한 형식은 무엇일까?
  • 분석을 위해 데이터 정제가 얼마나 필요할까?
  • 이 데이터 구조에 맞는 도구나 라이브러리는 무엇일까?

다루는 데이터가 정형인지 비정형인지 알면, 올바른 전략을 세우고 시행착오를 줄일 수 있습니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!