02 · Development Agent

빠르게 만들고, lock-in 없이 넘깁니다.

AI 서비스 · 사내 AX 도구 · Web3 dApp을 4종 deliverable로 핸드오프 — 코드와 함께 AI가 읽는 도큐먼트, E2E 가드레일, 운영 런북까지.

4종
Deliverables
자가
유지보수
주 단위
Progress
01 · WORKING CODE
// auth.ts
async function signIn(token) {
  - if (result === null) return
  + if (!result?.ok) throw err
  return result.user
}
02 · TWO-LAYER DOCS
# CLAUDE.md
## Architecture
- Next.js 14 · Postgres
## Skills
- migrate · deploy · e2e
## Invariants
- LLM 호출 0건
03 · E2E SUITE
42 / 42 PASSALL GREEN
auth · sign-in
1.2s
billing · checkout
3.8s
dashboard · usage
0.9s
04 · RUNBOOK
$ pnpm run deploy
✓ build (12.4s)
✓ migrate (2.1s)
✓ e2e smoke (8.7s)
→ rollback: ./rb.sh v0.4.2
→ on-call: pagerduty/dev
무엇을 만드나

3 영역. 모두 우리가 매일 쓰는 것들.

01

AI 서비스 빌드

내·외부 사용자용 AI 제품 — 데모 아닌 운영형.

02

팀내 AX 도구

사내 워크플로우 가속. AI Usage Tracker 그 자체.

03

Web3 dApp · 토크노믹스

컨트랙트부터 토큰 sale까지. 40~50K DAU 운영.

당신이 받는 것

작동하는 코드만 주지 않습니다.

4종 세트로 핸드오프 — 코드 · AI가 읽는 도큐먼트 · E2E 가드레일 · 운영 런북.

01

Working Code

당신 GitHub로 이관

// auth.ts
async function signIn(token) {
  - if (result === null) return
  + if (!result?.ok) throw err
  return result.user
}
02

Two-Layer Docs

AI용 · 사람용 분리

# CLAUDE.md
## Architecture
- Next.js 14 · Postgres
## Skills
- migrate · deploy · e2e
## Invariants
- LLM 호출 0건
03

E2E Suite

Playwright + CI 통합

42 / 42 PASSALL GREEN
auth · sign-in
1.2s
billing · checkout
3.8s
dashboard · usage
0.9s
04

Operational Runbook

배포 · 장애 · 모니터링

$ pnpm run deploy
✓ build (12.4s)
✓ migrate (2.1s)
✓ e2e smoke (8.7s)
→ rollback: ./rb.sh v0.4.2
→ on-call: pagerduty/dev
02 · Two-Layer Docs · 자세히

두 층의 도큐먼트로 사람과 AI 모두 시스템을 이해합니다.

사람용은 기존 산출물 그대로. AI용은 *시작용 4종 + 진행용 4종*으로 — Claude Code 같은 에이전트가 시스템 맥락과 의사결정 히스토리를 즉시 흡수할 수 있게 합니다.

A · 사람용

기존 산출물

개발자·매니저가 직접 읽는 도큐먼트

  • README.md
    프로젝트 개요·셋업
  • ADR (decisions)
    주요 의사결정 기록
  • API 문서
    엔드포인트·스키마
  • 운영 가이드
    배포·장애·모니터링
B-1 · AI용 시작

시작 시 컨텍스트

에이전트가 프로젝트를 *처음 만날 때* 읽는 4종

  • CLAUDE.md
    AI 에이전트 동작 규칙
  • CONTEXT.md
    프로젝트 맥락·기술 스택
  • SPEC.md
    기능 명세·invariants
  • DESIGN.md
    디자인 시스템·UI 결정
B-2 · AI용 진행

개발 중 기록

세션마다 누적되는 *살아있는 히스토리* 4종

  • state.md
    현재 집중·다음 액션
  • worklog.md
    세션별 작업 기록
  • decision.md
    대안 비교 후 결정
  • backlog.md
    백로그·우선순위
샘플 보기 — 실제 state.md / decision.md 발췌 (익명화)
state.mdAI · 진행
### 현재 집중
ACME 결제 파이프라인 — Stripe webhook
재시도 큐 + idempotency 검증

### 이어서 할 것
1. failed_webhook 테이블 + 재시도 정책
2. /api/billing/webhook idempotency-key 검증
3. E2E: stripe-mock으로 시나리오 3개

### 막힌 것
없음

### 사람 판단 필요
- 환불 정책 — prorated vs full
- 멤버 등급 다운그레이드 시점
decision.mdAI · 진행
## 2026-XX-XX: 결제 재시도 — 큐 vs cron

- **선택**: failed_webhook 테이블 + cron 재시도
- **대안 검토**:
  - (A) Bull/SQS 큐 — 빠르지만 인프라 추가
  - (B) 테이블 + cron(채택) — 단순, 모니터링 쉬움
- **선택 이유**: 트래픽 규모 작음(<10/s).
  운영 부담이 큐 도입보다 낮음
- **영향 범위**: schema · webhook route · cron
- **되돌리는 방법**: 큐로 마이그레이션 가능
03 · E2E Suite · 자세히

3단계 테스트 시나리오 — PR 가드부터 풀 커버리지까지.

한 가지 방식으로 모든 테스트를 돌리지 않습니다. *언제 무엇을 검증할지*에 따라 3단계로 분리 — 빠른 PR 가드, 매일 핵심 흐름, 주기적 풀 커버리지.

Tier 1

CI/CD smoke

모든 PR · 머지 차단 · ~2분
핵심 시나리오 5~8개

로그인 · 결제 · 메인 페이지 등 *깨지면 즉시 알아야 하는* 케이스만. PR마다 자동 실행, 실패 시 머지 차단.

Tier 2

Daily 주요 기능

매일 cron · ~10분
주요 user flow 30~50개

사용자가 *실제로 자주 쓰는* 흐름. 매일 새벽 자동 실행 → 결과 Slack 알림. Tier 1보다 광범위.

Tier 3

Full Suite

주간 · 릴리즈 전 · ~30분+
전체 600+ 케이스

엣지·예외 시나리오 포함 풀 커버리지. 릴리즈 전이나 주요 변경 후 실행. 자동화·수동·블록·스킵 분류 리포트 생성.

실제 샘플 리포트

Tier 3 풀 리포트 예시 — 모듈별 자동화율 · 실행 결과 · 모호·차단·수동·스킵 분류.

샘플 QA 리포트 보기
Lock-in 0

끝나면 당신이 직접 굴립니다.

Claude Code 한 대로 충분히 — AI-readable 도큐먼트 + E2E 가드레일이 안전장치.

문제

외주 후 유지보수 의존

대부분의 agency는 핸드오프 후에도 retainer로 매여 있게 만듭니다.

해결

AI-readable Docs + E2E

CLAUDE.md / Skills로 AI가 시스템을 이해하고, E2E가 골든 패스를 매번 검증.

증거

AI Usage Tracker

자체 도구가 도입 조직 인프라에 deploy. 풀 소스 공개, 외부 의존 0.

z21labs의 AX 수준

우리는 매일 AX를 측정·개선합니다.

AI Usage Tracker로 우리 팀의 AX를 측정·개선하여 AI를 통해 개발 효율화를 이루는 팀입니다. 우리가 AX를 통해 만든 시스템을 그대로 전해드립니다.

z21labs 사내 AX 측정 도구

AI Usage Tracker

z21labs가 자체 AX(AI 전환) 수준을 매일 측정·개선하는 도구. 우리 팀의 AI 사용량 · 사용 효율 · industry 비교까지 매일 본 후 다음 행동을 정합니다. 우리가 만들고 매일 쓰는 도구 — 이 도구를 만들며 쌓인 AX 경험을 당신 조직에도 그대로 전달합니다.

AI Usage Tracker — 팀 대시보드 (활용 지수 · 토큰 단가 · 멤버별 사용량 차트)
실제 화면 · 팀 데모열기 →
Telegram · LINE Mini dApp
40~50K DAU

Web3 dApp 4년+ 운영. 스마트 컨트랙트 · DEX · Bridge · Governance · Launchpad 풀스택. IDO/INO 토큰 sale 실행 경험.

검증된 스택
Next.js 14PostgreSQLDrizzle ORMAuth.jsPlaywrightTailwind
진행 방식

주 단위로 결과가 보입니다.

Week 0~1

Scope + 첫 작동 코드

요구사항 정리 · CLAUDE.md 골격 · 골든 패스 1개가 작동하는 코드까지.

Week 2~N

주간 데모 + GitHub 머지

매주 작동하는 데모. 우선순위 회고 · 다음 주 스코프 합의.

Week N

4종 Deliverables 인계

Code · Docs · E2E · Runbook 전부 이관. Lock-in 없는 종료.

30분 무료 진단

요구사항 정리 · 적합도 판단.

Week-1 미리보기

첫 주 결과 보고 본 계약.

Lock-in 없는 종료

4종 인계 후 강제 retainer 없음.

개발만 의뢰하셔도 좋고, AI Usage Tracker처럼 자체 운영 도구도 함께 만들어드립니다.

Let’s Talk

한국 시장에서 다음 단계를 만듭니다.

현재 도전 과제와 목표를 알려주세요. 확인 후 맞춤 전략을 제안드립니다.