본문으로 건너뛰기
실습하기

JSONL 데이터셋 만들기

앞서 배운 내용을 바탕으로 데이터셋을 만들고 적용해 보는 실습을 진행해 보겠습니다.


실습환경 소개

지금부터 챗GPT를 버르장머리 없는 반말 AI로 파인튜닝하기 위한 학습 데이터셋을 만들어 보겠습니다.

[이전 수업]에서 소개한 것처럼, 파인튜닝을 위한 JSONL 데이터셋은 최소 10개 이상의 대화 쌍을 포함해야 합니다.


반말 데이터셋 만들기

  1. 모달창: 데이터 선택 버튼을 클릭하여 모달창을 띄웁니다. (모달창: 데이터셋 파일 목록입니다.)

  2. 새 파일 생성: 상단에 새 파일 생성 버튼을 클릭합니다.

  3. 모드 선택: 간편모드는 데이터셋을 만들기 위한 간단한 모드입니다. 에디터는 JSONL 파일을 직접 작성할 수 있는 모드입니다.

  4. 데이터셋 작성: 파일명을 입력 후 만들기 버튼을 클릭하여 파일을 만듭니다.

  5. 파일 만들기: 파일명을 입력 후 만들기 버튼을 클릭하여 파일을 만듭니다.

  6. 적용: 만들어진 파일을 적용 버튼을 클릭하여 선택합니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!