본문 바로가기
카테고리 없음

SEQUENCE 하나로 굴리는 더미 데이터 공장: 테스트용 표를 1분 만에 만들기

by 시트자동화 2025. 8. 15.

Sequence_dummy 샘플데이터 관련 이미지
Sequence_dummy 샘플데이터 이미지

들어가며 - 함수 테스트나 보고서 예시를 만들 때마다 실제 업무 데이터를 복제하기는 부담스럽습니다. 이럴 때 규칙 기반의 더미 데이터를 신속하게 만들어 두시면, 재현 가능한 실습·검증·문서화를 한 번에 해결하실 수 있습니다. 여기서는 SEQUENCE를 중심으로 날짜·범주·수량·단가를 생성하고, 금액·가격대 구간·월 인덱스·요일 인덱스까지 파생 열을 붙여 “어디에나 바로 사용가능한” 표준 샘플을 만드는 과정을 안내드립니다.

자료 받기(바로 사용 가능)

샘플 데이터 설명: 필드 해설표

두 파일의 컬럼 구성은 아래와 같습니다. 파생본에는 분석·집계에 바로 쓰실 수 있도록 총 8개 열이 포함되어 있습니다.

원본 · 01_sequence_dummy.csv

컬럼 의미 예시값 형식·비고
date 연속 날짜 2025-01-01 YYYY-MM-DD
category 범주 코드 순환 A A/B/C
qty 수량 3 정수(≥1)
price 단가 12000 정수(원)

파생본 · 01_sequence_dummy_enriched.csv

컬럼 의미 예시값 형식·비고
date 연속 날짜 2025-01-01 YYYY-MM-DD
category 범주 코드 B A/B/C
qty 수량 5 정수
price 단가 11000 정수(원)
amount 금액 55000 qty×price
unit_band 단가 구간 Mid Low/Mid/High
month 월 인덱스 2025-01 YYYY-MM
weekday_1to7 요일 번호 3 월=1 … 일=7

설계 의도: 원본으로 생성 규칙을 설명하고, 파생본은 집계(예: SUMIFS)·시계열(누계·MoM·YoY)·품질점검(분포·구간) 실습에 바로 투입할 수 있도록 구성했습니다.

만드는 순서: 핵심 단계만 잡고 가겠습니다

  1. 연속 날짜 뽑기=DATE(2025,1,1)+SEQUENCE(30)
    30일 테스트셋이 기본입니다. 월 단위 키가 필요하시면 =EOMONTH(DATE(2025,1,1),SEQUENCE(12)-1)로 월말 배열을 만드시면 집계가 안정적입니다.
  2. 범주 순환=INDEX({"A";"B";"C"}, MOD(SEQUENCE(30)-1,3)+1)
    코드표가 있다면 이 자리에 코드 배열을 넣어 동일 규칙으로 순환시키시면 됩니다.
  3. 수량·단가=RANDBETWEEN(1,9), =RANDBETWEEN(8000,15000)
    주말 가중치가 필요하시면 qty+IF(WEEKDAY(date,2)>=6,2,0)처럼 간단히 보정하실 수 있습니다.
  4. 파생 열
    금액: =qty*price
    단가 구간: =CHOOSE(TRUE,price<10000,"Low",price<13000,"Mid","High")
    월: =TEXT(date,"yyyy-mm") 또는 보고 키로 =EOMONTH(date,0)
    요일: =WEEKDAY(date,2)
  5. 변수화로 유지보수=LET(q,qty,p,price, q*p)처럼 변수화하시면 열 이동에도 공식을 쉽게 관리하실 수 있습니다.

점검은 짧고 굵게: 필수 검증 루틴

  • 행·열 수 고정: =COUNTA(date)=30
  • 금액 무결성: =SUM(amount)=SUM(qty*price)
  • 단가 구간 범위: Low/Mid/High 외 값이 없는지 확인
  • 연속성: 날짜 중복·누락 없음(정렬 후 date[i]=date[i-1]+1 검증)
  • 난수 고정: 보고 시점에는 값 붙여넣기(재계산 변동 방지)

숫자는 같은데 리포트가 다르게 나올 때

월 키를 임의 날짜로 쓰면 같은 달 데이터가 서로 다른 키로 그룹핑되는 사고가 자주 발생합니다. 집계 기준이 “월”이라면 키를 월말(EOMONTH)로 통일해 주십시오. 또한 열 전체(예: A:A)를 무분별하게 참조하면 재계산 부하가 급증하므로, 테이블(표) 범위를 쓰고 필요 시 값을 확정하는 전략을 권장드립니다.

실무 현장에 바로 꽂는 응용

  1. 집계 연습(피벗 없이)month×category를 키로 SUMIFS·COUNTIFS를 적용하면 월·범주 매출표가 금방 나옵니다.
  2. 시계열 파생 — 월별 합계에서 누계(SCAN 패턴)·전월대비(pct_change 상응)·전년동기(EDATE(...,-12))를 뽑아 보십시오.
  3. 리포트 문장화 — “7월 매출은 xx원(△yy%)” 같은 문장을 CONCAT·TEXTJOIN으로 자동 생성하면 대시보드 없이도 설명 가능한 보고가 됩니다.
  4. 품질 지표 — 요일·가격대 구간 분포를 월별로 카운트하면 수요 패턴이나 입력 이상을 빠르게 포착하실 수 있습니다.

자주 묻는 시행착오와 대처

  • 난수 흔들림 — 매번 값이 달라 비교가 어렵습니다 → 최종본에서 값 확정(붙여넣기)으로 고정해 주세요.
  • 배열 길이 불일치 — 다른 시트에서 붙여오다 보면 길이가 어긋납니다 → 모든 파생 열을 동일 SEQUENCE 길이에 의존시키십시오.
  • 통화 표기 혼선 — 셀 서식과 값이 섞이면 합계가 흔들립니다 → 통화는 “정수(원)”로 통일하고 서식과 계산 규칙을 문서 첫머리에 명시해 주세요.

복사용 스니펫 묶음

-- 날짜 30일
=DATE(2025,1,1)+SEQUENCE(30)

-- 카테고리 순환
=INDEX({"A";"B";"C"}, MOD(SEQUENCE(30)-1,3)+1)

-- 수량·단가
=RANDBETWEEN(1,9)
=RANDBETWEEN(8000,15000)

-- 파생 열
amount      =qty*price
unit_band   =CHOOSE(TRUE,price<10000,"Low",price<13000,"Mid","High")
month       =TEXT(date,"yyyy-mm")
weekday     =WEEKDAY(date,2)

정리하며

표준 더미 데이터는 “빠르게 시작하고, 여러 글에서 재사용하는” 기반 인프라입니다. 위의 규칙과 파일을 그대로 쓰시면 스크린샷 없이도 같은 결과를 손쉽게 재현하실 수 있습니다.