원하는 형식에 맞게 데이터 생성하기
업무를 하다 보면, 연습이나 테스트를 위해 가상 데이터를 생성해야 하는 경우가 있습니다. 예를 들어, 신규 소프트웨어의 테스트 및 시뮬레이션을 위해 가상 고객 데이터를 생성하거나, 인공지능 교육을 위한 연습용 학습 데이터가 필요할 수 있습니다.
이렇게 특정한 상황에 맞게 데이터를 생성해야 할 때, AI를 활용하면 효율적으로 데이터를 생성할 수 있습니다.
그렇다면 AI를 활용해 데이터를 생성할 때 유의해야 할 점은 어떤게 있을까요? 먼저, 데이터를 생성할 때 원하는 형식을 명확히 정의해야 합니다. 데이터의 형식이 명확하지 않으면, AI가 생성한 데이터가 원하는 형식과 맞지 않을 수 있습니다.
지금부터 IT 업계에서 자주 사용하는 데이터 형식 3가지를 소개하겠습니다.
JSON
JSON은 J
avaS
cript O
bject N
otation의 약자로, 주로 웹/모바일 애플리케이션에서 사용되는 데이터 저장/교환 형식입니다.
JSON은
-
객체: 중괄호
{ }
로 묶인 데이터로, 키(Key)-값(Value) 쌍으로 이루어짐- 키는 쌍따옴표로 묶음
- 값은 여러 문자로 구성된 문자열, 숫자, 배열, 객 체 등이 될 수 있음
-
배열: 대괄호
[ ]
로 묶인 데이터로, 순서가 있는 값의 목록- 배열 내 요소는 쉼표로 구분
- 요소는 문자열, 숫자, 객체, 배열 등이 될 수 있음
로 구성되며, 사람과 컴퓨터 모두 이해하기 쉬운 형식입니다.
// 2개의 객체로 이루어진 배열
[
{
"이름": "김철수", // 키-값 쌍으로 이루어진 객체
"수학": 85,
"영어": 90,
},
{
"이름": "이서원",
"수학": 88,
"영어": 80,
}
]
XML
XML은 'eXtensible Markup Language'의 약자로, 주로 데이터의 계층 구조를 표현할 때 사용합니다.
XML은
-
태그:
< >
로 묶인 데이터로, 데이터의 계층 구조 표현- 태그는 시작 태그와 종료 태그로 이루어짐
- 시작 태그는
<태그명>
, 종료 태그는</태그명>
으로 표현
-
속성: 태그 내에 추가 정보를 표현할 때 사용
- 태그에 속성을 추가하려면
<태그명 속성명="속성값">
형식으로 표현 - 예를 들어,
<학생 성별="남">
은 학생 태그에 성별 속성을 추가한 예시
- 태그에 속성을 추가하려면
로 구성됩니다.
JSON에서 예시로 활용한 학생 데이터를 XML로 표현하면 다음과 같습니다.
<학생명단>
<학생>
<이름>김철수</이름>
<수학>85</수학>
<영어>90</영어>
</학생>
<학생>
<이름>이서원</이름>
<수학>88</수수학>
<영어>80</영어>
</학생>
</학생명단>
CSV
CSV는 'Comma-Separated Values'의 약자로, 데이터를 쉼표(,)로 구분하는 텍스트 형식입니다.
이름,수학,영어
김철수,85,90
이서원,88,80
CSV에 대한 자세한 설명은 이전 수업을 참고해 주시기 바랍니다.
데이터 생성 프롬프트 작성하기
데이터를 생성할 때는 데이터의 형식
을 명시하고, 몇 개의 데이터 예시를 제공하는 퓨샷 프롬프팅
을 활용하는 것이 좋습니다.
예를 들어, JSON 형식으로 학생 데이터를 생성하는 프롬프트를 작성해 보겠습니다.
### 지시문: 아래 JSON 예시를 참고해, 학생 데이터를 생성해 주세요. JSON 배열 내 4개의 학생 데이터 객체가 포함되어야 합니다.
### JSON 예시
[
{
"이름": "김철수",
"수학": 85,
"영어": 90
},
{
"이름": "이서원",
"수학": 88,
"영어": 80
}
]
위 프롬프트에서는 ###
구분자를 활용해 프롬프트를 구조화했고, 2개의 학생 데이터 예시를 제공했습니다. AI에게는 4개의 학생 데이터 객체를 생성하도록 요청했습니다.
이렇게 요구 상황에 맞게 데이터 형식을 명시하고 데이터를 생성하는 프롬프트를 작성하면, 효과적으로 테스트/연습용 데이터를 생성할 수 있습니다.
실습
프롬프트 예제를 보내고 AI의 답변을 비교해 보세요.
다음 내용이 궁금하다면?
코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!