들어가며 - 함수 테스트나 보고서 예시를 만들 때마다 실제 업무 데이터를 복제하기는 부담스럽습니다. 이럴 때 규칙 기반의 더미 데이터를 신속하게 만들어 두시면, 재현 가능한 실습·검증·문서화를 한 번에 해결하실 수 있습니다. 여기서는 SEQUENCE
를 중심으로 날짜·범주·수량·단가를 생성하고, 금액·가격대 구간·월 인덱스·요일 인덱스까지 파생 열을 붙여 “어디에나 바로 사용가능한” 표준 샘플을 만드는 과정을 안내드립니다.
자료 받기(바로 사용 가능)
- 원본 30행: 01_sequence_dummy.csv
- 파생 열 포함본: 01_sequence_dummy_enriched.csv
샘플 데이터 설명: 필드 해설표
두 파일의 컬럼 구성은 아래와 같습니다. 파생본에는 분석·집계에 바로 쓰실 수 있도록 총 8개 열이 포함되어 있습니다.
원본 · 01_sequence_dummy.csv
컬럼 | 의미 | 예시값 | 형식·비고 |
---|---|---|---|
date |
연속 날짜 | 2025-01-01 |
YYYY-MM-DD |
category |
범주 코드 순환 | A |
A/B/C |
qty |
수량 | 3 |
정수(≥1) |
price |
단가 | 12000 |
정수(원) |
파생본 · 01_sequence_dummy_enriched.csv
컬럼 | 의미 | 예시값 | 형식·비고 |
---|---|---|---|
date |
연속 날짜 | 2025-01-01 |
YYYY-MM-DD |
category |
범주 코드 | B |
A/B/C |
qty |
수량 | 5 |
정수 |
price |
단가 | 11000 |
정수(원) |
amount |
금액 | 55000 |
qty×price |
unit_band |
단가 구간 | Mid |
Low/Mid/High |
month |
월 인덱스 | 2025-01 |
YYYY-MM |
weekday_1to7 |
요일 번호 | 3 |
월=1 … 일=7 |
설계 의도: 원본으로 생성 규칙을 설명하고, 파생본은 집계(예: SUMIFS
)·시계열(누계·MoM·YoY)·품질점검(분포·구간) 실습에 바로 투입할 수 있도록 구성했습니다.
만드는 순서: 핵심 단계만 잡고 가겠습니다
- 연속 날짜 뽑기 —
=DATE(2025,1,1)+SEQUENCE(30)
30일 테스트셋이 기본입니다. 월 단위 키가 필요하시면=EOMONTH(DATE(2025,1,1),SEQUENCE(12)-1)
로 월말 배열을 만드시면 집계가 안정적입니다. - 범주 순환 —
=INDEX({"A";"B";"C"}, MOD(SEQUENCE(30)-1,3)+1)
코드표가 있다면 이 자리에 코드 배열을 넣어 동일 규칙으로 순환시키시면 됩니다. - 수량·단가 —
=RANDBETWEEN(1,9)
,=RANDBETWEEN(8000,15000)
주말 가중치가 필요하시면qty+IF(WEEKDAY(date,2)>=6,2,0)
처럼 간단히 보정하실 수 있습니다. - 파생 열
금액:=qty*price
단가 구간:=CHOOSE(TRUE,price<10000,"Low",price<13000,"Mid","High")
월:=TEXT(date,"yyyy-mm")
또는 보고 키로=EOMONTH(date,0)
요일:=WEEKDAY(date,2)
- 변수화로 유지보수 —
=LET(q,qty,p,price, q*p)
처럼 변수화하시면 열 이동에도 공식을 쉽게 관리하실 수 있습니다.
점검은 짧고 굵게: 필수 검증 루틴
- 행·열 수 고정:
=COUNTA(date)=30
- 금액 무결성:
=SUM(amount)=SUM(qty*price)
- 단가 구간 범위:
Low/Mid/High
외 값이 없는지 확인 - 연속성: 날짜 중복·누락 없음(정렬 후
date[i]=date[i-1]+1
검증) - 난수 고정: 보고 시점에는 값 붙여넣기(재계산 변동 방지)
숫자는 같은데 리포트가 다르게 나올 때
월 키를 임의 날짜로 쓰면 같은 달 데이터가 서로 다른 키로 그룹핑되는 사고가 자주 발생합니다. 집계 기준이 “월”이라면 키를 월말(EOMONTH
)로 통일해 주십시오. 또한 열 전체(예: A:A
)를 무분별하게 참조하면 재계산 부하가 급증하므로, 테이블(표) 범위를 쓰고 필요 시 값을 확정하는 전략을 권장드립니다.
실무 현장에 바로 꽂는 응용
- 집계 연습(피벗 없이) —
month
×category
를 키로SUMIFS
·COUNTIFS
를 적용하면 월·범주 매출표가 금방 나옵니다. - 시계열 파생 — 월별 합계에서 누계(SCAN 패턴)·전월대비(
pct_change
상응)·전년동기(EDATE(...,-12)
)를 뽑아 보십시오. - 리포트 문장화 — “7월 매출은 xx원(△yy%)” 같은 문장을
CONCAT
·TEXTJOIN
으로 자동 생성하면 대시보드 없이도 설명 가능한 보고가 됩니다. - 품질 지표 — 요일·가격대 구간 분포를 월별로 카운트하면 수요 패턴이나 입력 이상을 빠르게 포착하실 수 있습니다.
자주 묻는 시행착오와 대처
- 난수 흔들림 — 매번 값이 달라 비교가 어렵습니다 → 최종본에서 값 확정(붙여넣기)으로 고정해 주세요.
- 배열 길이 불일치 — 다른 시트에서 붙여오다 보면 길이가 어긋납니다 → 모든 파생 열을 동일
SEQUENCE
길이에 의존시키십시오. - 통화 표기 혼선 — 셀 서식과 값이 섞이면 합계가 흔들립니다 → 통화는 “정수(원)”로 통일하고 서식과 계산 규칙을 문서 첫머리에 명시해 주세요.
복사용 스니펫 묶음
-- 날짜 30일
=DATE(2025,1,1)+SEQUENCE(30)
-- 카테고리 순환
=INDEX({"A";"B";"C"}, MOD(SEQUENCE(30)-1,3)+1)
-- 수량·단가
=RANDBETWEEN(1,9)
=RANDBETWEEN(8000,15000)
-- 파생 열
amount =qty*price
unit_band =CHOOSE(TRUE,price<10000,"Low",price<13000,"Mid","High")
month =TEXT(date,"yyyy-mm")
weekday =WEEKDAY(date,2)
정리하며
표준 더미 데이터는 “빠르게 시작하고, 여러 글에서 재사용하는” 기반 인프라입니다. 위의 규칙과 파일을 그대로 쓰시면 스크린샷 없이도 같은 결과를 손쉽게 재현하실 수 있습니다.