728x90
GPT로 데이터 정의서 쉽게 자동화하기
많은 데이터를 관리할 때 데이터 정의서는 꼭 필요하지만, 만드는 데 시간이 많이 걸립니다.
이제는 GPT를 활용해서 데이터 정의서를 빠르고 쉽게 자동으로 만들 수 있습니다.
어떻게 할까?
- 프롬프트만 잘 만들면 테이블명, 컬럼 설명 등 정의서가 자동으로 작성돼요.
- 고객사가 자료를 많이 제공해도, GPT에 입력하면 대량의 정의서를 한 번에 만들 수 있습니다.
보안도 중요!
- 민감한 정보(개인정보 등)는 미리 빼고,
- 예시 값이 필요하면 첫 번째 값만 보여주어 데이터가 새지 않도록 합니다.
효과
- 정의서 만드는 시간이 크게 줄어요.
- 반복 작업이 쉬워집니다.
- 보안도 신경 쓰니, 안심하고 쓸 수 있습니다.
프롬프트
- 하기 프롬프트 2개를 순서대로 그대로 복붙하여 사용 가능합니다.
- 1번 프롬프트 복붙 + 엔터 -> 엑셀파일 업로드 -> 2번 프롬프트 복붙 + 엔터 -> 최종결과 도출
- 도메인은 직접 작성이 필요합니다.
작업 요청: 데이터 정의서(.xlsx) 자동 생성
도메인 : 농업
목표 : 업로드하는 도메인의 엑셀 데이터를 기반으로 데이터 정의서를 .xlsx 파일 형식으로 생성해 주세요.
세부 조건 :
1. 엑셀 파일이 여러 개일 경우, 3개씩 묶어서 순차적으로 처리해 주세요.
1-1. .xlsx 파일을 클릭해서 직접 다운로드 가능하도록 하려면, 아래와 같이 다운로드 가능한 URL 형태로 결과를 제공
1-2. 데이터 정의서가 성공적으로 생성되었습니다. 아래 파일명을 클릭하면 .xlsx 파일을 직접 다운로드할 수 있습니다:
1-2-1. [(190101)비닐_주차수_데이터정의서.xlsx](sandbox:/mnt/data/(190101)비닐_주차수_데이터정의서.xlsx)
1-2-2. [(190101)유리_주차수_데이터정의서.xlsx](sandbox:/mnt/data/(190101)유리_주차수_데이터정의서.xlsx)
2. 생성되는 데이터 정의서에는 아래 항목이 포함되어야 합니다:
2-1. 변수명
2-2. 데이터 타입 (int, float, object 등)
2-3. 결측값 여부 (TRUE, FALSE)
2-4. 대표값 (실수/정수는 nan제외 첫번째 값 1개, 명목형은 대표값 1개)
3. 대표값 처리 기준:
3-1. 숫자형 변수 (int, float)
3-2. float는 소수점 셋째 자리까지만 표시
3-3. 명목형 변수 (object, category 등): 첫 번째 값 기준으로 표시
4. 정의서 시트의 **첫 번째 행(헤더)**은 다음과 같이 강조:
4-1. 글씨 크기 크게
4-2. 배경 색상 노란색
5. 각 원본 엑셀 파일에 대해 개별적인 데이터 정의서 파일을 생성
5-1. 원본 파일명에 한글이 포함되어 있다면, 해당 부분은 간단한 영문 매핑(예: "비닐" → "vinyl", "주차수" → "week")을 적용해 변환합니다.
예시: (190101)_비닐_주차수.xlsx → (190101)_vinyl_week.xlsx
한글이 포함된 유니코드 조합형(NFC/NFD) 문제를 방지하기 위해 반드시 영문으로 변환하여 사용합니다.
최종 파일명은 변환된 영문 파일명 뒤에 _data_definition을 붙여 .xlsx 확장자로 저장합니다.
예시: (190101)_vinyl_week_data_definition.xlsx
최종 산출물에서 변수명을 확인한 후, 농업 도메인 기준으로 해석하여 변수 설명을 작성합니다.
작성한 변수 설명을 "변수설명"이라는 마지막 열에 추가한 엑셀 파일을 생성합니다.
최종 결과
- 결과는 다음과 같은 엑셀(.xlsx)로 출력됩니다.

728x90