본문으로 건너뛰기
실습하기

머신러닝에서 특징이란?

머신러닝에서 특징(Feature)은 모델이 학습하는 데 사용하는 개별적인 속성이나 변수를 의미합니다.

예를 들어 집값을 예측하는 머신러닝 모델을 만든다면 위치, 면적, 방 개수 등이 데이터의 특징이 될 수 있습니다.

머신러닝 모델은 특징을 통해 데이터셋에서 데이터의 패턴을 학습하고, 새로운 데이터에 대한 예측을 수행합니다.


특징의 예시

특징은 데이터의 종류에 따라 다르게 정의됩니다.

다음은 머신러닝 모델별 특징의 예시입니다.

고객 만족도 분석

  • 고객 연령
  • 구매 횟수
  • 마지막 구매 이후 지난 일수
  • 제품 리뷰 점수

스팸 이메일 판별

  • 이메일 제목에 특정 단어 포함 여부 ("무료", "당첨")
  • 이메일 길이
  • 발신자 주소의 신뢰도 점수

머신러닝 모델은 이러한 특징들을 바탕으로 데이터의 패턴을 학습하고, 새로운 데이터가 입력되면 해당 데이터가 어떤 카테고리에 속하는지 예측합니다.

예를 들어 이메일 스팸 필터 머신러닝 수신한 이메일 제목에 '무료'가 포함되고, 이메일이 너무 길면 해당 이메일을 스팸으로 판단할 수 있습니다.

특징이 정확하고 의미 있게 정의하는 것은 머신러닝 모델의 성능을 높이는 데 굉장히 중요합니다.

이렇게 데이터의 특징을 선택하고 변형하여 모델 성능을 향상시키는 작업을 특징 엔지니어링(feature engineering)이라고 합니다.


다음 수업에서는 특성 선택차원 축소에 대해 자세히 알아보겠습니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!