11 Commits
v0.4.0 ... main

Author SHA1 Message Date
c18dca1def [Designer] #342 UX round 2 — chat 빈 상태 + 한국식 날짜 + 표현 방식
남은 P1/P2 3건.

- ChatScreen 빈 상태: 아이콘 + 한 줄 설명 + 예시 prompt 4개
  (tap → _textCtrl 자동 채움, 자동 send X).
- CheckIn 날짜: '2026-06-15' raw → '6월 15일 (월)' 한국식.
  DB 저장은 _ymd 유지.
- HabitCreate '프레임 레벨' → '표현 방식' + helperText.
  아이템: '조건부 행동 (예: 아침에 햇빛 받기)' / '정체성 (예: 나는 일찍 자는 사람)'.
- 설계서 #342 README — D 섹션 + AC-D1/D2/D3 추가.
- CHANGELOG v0.4.2 UX round 2 블록.

167 tests passed, analyze clean.

Refs #342
2026-06-15 15:28:03 +09:00
e81f3e44a4 [Designer] #342 UX round 1 — raw enum → 한국어 라벨 + 스트릭 hero
dev v0.4.2 위 hotfix. v0.4.1 단말 테스트에서 발견된 raw 식별자
노출 P0 3 + P1 2.

- ui/labels.dart 신규 — habitTypeLabel(FromDb) / rewardTierLabel.
  domain enum 의 한국어 라벨 단일 지점 (domain layer 분리).
- habit_list 부제: 'build · L3 · …' → '만들기 · …'.
  FrameLevel 노출 제거 (시스템 규약).
- streak: 'T0' / 'T1' raw → '🌱 새싹' / '🥉 3회 도전' …,
  영문 'Never miss twice' → '이틀 연속 빠졌어요. 한 단계 강등됐습니다',
  현재 스트릭을 displayLarge hero 로 위계 강조.
- habit_create 드롭다운: '만들기 (build)' → '만들기'.
- 설계서 docs/design/342-v042-hotfix/README.md — A/B/C 11 AC.
- CHANGELOG v0.4.2 에 UX round 1 섹션 추가.

167 tests passed, analyze clean. APK 재빌드 보류 (사용자 결정).

Refs #342
2026-06-15 15:23:05 +09:00
3b8ea95aa6 [hotfix] #342 v0.4.2 — ChatScreen SafeArea + LLM 에러 진단 노출
Fix
- ChatScreen body 를 SafeArea(top: false) 로 감쌈. Android edge-to-edge
  모드에서 시스템 nav bar 가 입력창을 덮던 문제 해결.

Dev (#342)
- userTurn catch 블록이 e.toString() + stack trace 를 error 상태에 저장.
- 빨간 에러 컨테이너를 SingleChildScrollView + SelectableText (monospace)
  + 최대 화면 1/3 높이 제약. 스크롤 + 복사 가능. release 빌드에서도
  full stack 노출 (#342 종료 후 follow-up 으로 좁힘).

테스트: chat_session_controller_test 8/8 통과.
APK: app-release.apk 301.0MB SHA 02a5d1c8.

Refs #342
2026-06-15 14:30:21 +09:00
94a9cd474b [Architect] #312 design spec — tool call prefix corpus & 조건부 push
설계서 3 + 절차서 1.
- README.md: 기능 설계서 (15 케이스 corpus, 임계 5/15, 경로 A/B)
- fn-corpus_logger.md: optional debug logger (kDebugMode + dart-define 가드)
- fn-userTurn_partial_push.md: chat_providers.dart 의 break 분기 수정안 (경로 A/B)
- corpus-procedure.md: 빌드/캡처/15 프롬프트/임계 판정 절차

R1-R5 모두 해소 (Architect 채택안).
ADR-0006 슬롯 = 경로 B 채택 시 작성 (Developer 단계).

Refs #312
2026-06-15 14:17:47 +09:00
41457ab96e [08-Documenter] #311 설계서 Approved + reference + 사용자 가이드 FAQ
- docs/design/311-llm-warmup/ 3파일 상태 Draft → Approved (v0.4.1)
- docs/reference/311-llm-warmup.md 신규 (상태 머신, API, UI binding,
  마이크로카피, 테스트)
- docs/guides/ai-chat-using.md 헤더 + FAQ 2건 추가 (warmup 인지/회복)

Refs #311
2026-06-15 13:25:38 +09:00
121108f63c [07-Release] #311 v0.4.1 — ChatScreen LLM warm-up
CHANGELOG 0.4.1 항목 + pubspec 0.4.0+4 → 0.4.1+5.

Release artifact:
- app-release.apk 288MB (301.0MB raw / 288MB on-disk)
- SHA-256: 62b96a876afbda24e1cd3b9bf95db742255db5f40fc46eb08cb5cf824d3ec481
- Build: flutter build apk --release (Gradle assembleRelease 70.2s)

KGP deprecation 경고 (device_info_plus, flutter_gemma, large_file_handler)
는 v0.4.0 release 노트와 동일. 미해결.

Refs #311
2026-06-15 13:22:34 +09:00
071afefc54 [06-Reviewer] #311 fileMissing 회복 자동화
SettingsScreen pop 후 ChatScreen state 가 여전히 Failed(fileMissing)
인 회로 — 사용자가 다운로드를 끝내고 돌아와도 ChatScreen 전체를
pop & re-push 해야 회복되는 UX gap.

Navigator.push().then((_) => retry()) 로 SettingsScreen 닫힐 때
자동 retry. quickCheck 다시 → ready 면 load → Ready 회복.
다운로드 안 했으면 다시 Failed 로 떨어져 같은 배너 노출 (일관).

`context.mounted` 가드는 ChatScreen 이 dispose 된 race 대비.

Refs #311
2026-06-15 13:17:56 +09:00
7c90eca30c [05-Designer] #311 fileMissing 분기 [설정으로 가기] 버튼
UX-REVIEW.md §마이크로카피 사전에서 fileMissing 케이스에 [설정으로
가기] 를 명시했으나 Developer 구현은 모든 kind 가 [다시 시도] 였음.
fileMissing 에서 retry 해도 파일이 없어 같은 결과 → 사용자 막힘.

- ChatWarmupFailureKind.fileMissing → SettingsScreen push (다운로드
  재시도 경로 노출)
- ChatWarmupFailureKind.runtime → 기존 retry() 유지 (일시적 회복 가능)

여전히 메시지 본문은 상태 기술만 (AC12), 행동은 버튼이 담당 (UX R5).

Refs #311
2026-06-15 13:08:32 +09:00
5b4c05316a [03-Developer] #311 LLM warm-up + concurrent guard + quickCheck
ChatScreen 마운트 시 백그라운드 native init 으로 첫 send 시점에 native
load 지연을 안 보이게 한다. 12개 AC + UX-Reviewer 의 6개 권고 모두 코드
반영.

핵심 변경:
- `chat_warmup_provider.dart` — `ChatWarmupController` (Idle/Loading/Ready
  /Unavailable/Failed sealed state). fast path (`llm.isLoaded` → Ready),
  FileSystemException ↔ runtime kind 분기, _disposed race guard.
- `model_lifecycle.dart` — `quickCheck()`: 2.4GB SHA-256 hashing 없이
  meta_kv + 파일 존재만 보고 ready 추정 (R4 UX 권고).
- `gemma_llm_service.dart` + `llm_service.dart` — `_loadingFuture` 동시
  호출 가드. 두 caller 가 동시에 load() 해도 native init 은 1 회만.
- `chat_screen.dart` — initState postFrameCallback 에서 warmup.start().
  warmup 상태에 따라 hintText / spinner / 실패 banner 분기.

AC coverage (12개):
- AC1~AC8: ChatWarmupController unit (chat_warmup_test.dart 8 tests).
- AC9~AC12: UX-Reviewer 의 4개 권고 (입력 enabled / send auto-activate /
  fast path no-flicker / 명령형 메시지 금지) — controller 레벨에서 검증.

테스트: 167 passed (1 pre-existing skip). `flutter analyze` clean.

Refs #311

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-06-15 12:52:50 +09:00
1fa4f24a8a [02-Architect] #311 design spec + UX-Reviewer persona for LLM warm-up
- docs/design/311-llm-warmup/README.md — 기능 설계서. ChatWarmupController (5-state) + GemmaLlmService _loadingFuture concurrent guard + ModelLifecycle.quickCheck (lightweight ready).
- docs/design/311-llm-warmup/UX-REVIEW.md — UX-Reviewer parallel pass. Strong 4 + Suggest 2 권고. 입력창 enabled 유지 (타이핑 가능) + hintText 만 교체 + 상태-행동 분리.
- docs/design/311-llm-warmup/fn-chat_warmup_controller.md — start/retry 상세 + 빠른 경로 (isLoaded 시 Loading skip).
- docs/design/311-llm-warmup/fn-concurrent_load_guard.md — _loadingFuture 패턴 + whenComplete cleanup.
- .claude/agents/ux-reviewer.md — 신규 페르소나 (02-Architect 단계 내 parallel reviewer, 카테고리 부여 X).

AC 8 → 12 (UX 신규 4건 통합). OQ 3건 모두 해소. ADR 없음 (backward-compatible 추가).

Refs #311 #260
2026-06-15 11:41:03 +09:00
44d571f4ee [08-Documenter] #260 reference + user guide for v0.4.0 in-app tool calling
- docs/reference/260-in-app-tool-calling.md — 구현 후 동기화. 11 섹션 (모듈 지도 / 6 tool 표 / R 규칙 enforce / multi-turn 루프 / dispatcher / ConfirmGate / 2KB cap / LlmChatSession 두 구현 / UI 진입점 / 테스트 / known limitations).
- docs/guides/ai-chat-using.md — 사용자 대상 how-to. 진입(🤖) / 대화 예시 / 확인 게이트 / 안전장치 / FAQ.
- 후속 4건 Redmine 이슈 발행: #306 koreanLabel 필드 / #307 blank confirm skip / #308 category case-insensitive / #309 KGP deprecation.

Refs #260
2026-06-15 11:19:57 +09:00
29 changed files with 2512 additions and 63 deletions

View File

@@ -0,0 +1,44 @@
---
name: ux-reviewer
description: "[AI] UX-Reviewer — 02-Architect 의 설계서 + Planner AC 를 사용자 흐름·정신 모델·마찰 관점에서 검토. 파이프라인 카테고리는 부여하지 않는 parallel reviewer."
tools: Bash, Read, Edit, Write, Grep, Glob
model: opus
---
너는 life-helper 파이프라인의 **[AI] UX-Reviewer** 다.
시작 전에 반드시 읽는다: `CLAUDE.md`, `docs/pipeline/QUEUE-PROTOCOL.md`.
## 위치
- 파이프라인 카테고리 부여 X. **02-Architect 단계 내**에서 설계서가 작성된 직후 parallel 로 동작한다.
- 작업 큐 직접 소비 X — Architect 가 본인 작업 끝낼 때 명시적으로 UX-Reviewer 호출.
- 결과는 Architect 가 흡수 → 03-Developer 인계.
## 역할 (Designer 와의 차이)
| | Designer (05) | UX-Reviewer (이 페르소나) |
|---|---|---|
| 시점 | 코드 작성 후 polish | 설계 단계 (코드 전) |
| 대상 | microcopy / 색상 / contrast | 사용자 흐름 / 정신 모델 / 마찰 |
| 산출물 | 코드 수정 | 설계서에 통합되는 리뷰 노트 |
## 검토 관점
- **흐름**: 사용자가 화면에 들어와서 첫 의미있는 행동까지의 경로. 단계 누락 / 막다른 길 / 되돌아갈 수 없는 지점.
- **정신 모델**: 사용자가 "지금 무슨 일이 일어나는가" 를 추론 가능한가. 상태가 숨어있지 않은가.
- **마찰**: 사용자가 멈춰야 하는 모든 지점 — disabled 상태, 모달, 확인, 에러. 정당한가, 줄일 수 있는가.
- **지연 / 비동기**: 로딩 / 진행 / 실패 상태가 명시적인가. 사용자가 기다리는 동안 무엇을 보는가.
- **에러 회복**: 실패 후 사용자가 다시 시도할 수 있는가. 다음 행동이 명확한가.
- **취소 / 탈출**: 사용자가 흐름을 떠날 수 있는가. 진행 중 state 가 어떻게 되는가.
- **접근성 / 다국어**: 라벨이 한국어 자연 톤인가. 시각 대비. 터치 타겟 크기.
## 산출물
- 설계서 디렉토리에 `UX-REVIEW.md` 추가 또는 README 의 `## UX 리뷰` 섹션.
- 형식: **권고 (Strong / Suggest / Question)** × (관점, 근거, 제안).
- **Strong**: 사용자가 막힐 위험. Architect 가 설계 변경 또는 명시 거절 (OQ로) 해야 함.
- **Suggest**: 사용자 경험이 더 좋아짐. 채택은 Architect 재량.
- **Question**: 결정 전 더 정보 필요. Architect 또는 후속 사용자 인터뷰.
- 각 항목에 Planner AC 번호와 mapping (어느 AC 의 해석을 좁히거나 넓히는지).
## 핸드오프
- 코드/설계 직접 수정 X — 모든 변경은 Architect 가 흡수.
- 산출물 git 커밋 가능 (`[UX-Reviewer] #<ID> ...`).
- Redmine 저널에 1-line 요약.

View File

@@ -3,6 +3,58 @@
본 프로젝트의 모든 의미있는 변경은 본 파일에 기록한다.
형식: [Keep a Changelog](https://keepachangelog.com/) · 버전: [SemVer](https://semver.org/).
## [0.4.2] — 2026-06-15 (hotfix, dev)
### Fixed (Redmine #342)
- **ChatScreen 하단 잘림** — Android edge-to-edge 모드에서 시스템 nav bar (3-button / gesture handle) 가 입력창을 덮던 문제. `Scaffold.body``SafeArea(top: false, …)` 로 감쌈. AppBar 가 이미 top inset 처리하므로 top 만 false.
### UX round 1 — raw enum 노출 정리 (Redmine #342 추가)
- **습관 카드 부제** — `build · L3 · …` (raw enum) → `만들기 · …`. FrameLevel 노출 제거 (시스템 규약이라 사용자 가치 낮음).
- **스트릭 화면 현재 티어** — `T0` / `T1` raw → `🌱 새싹` / `🥉 3회 도전` / `🥈 7일 형성` / `🥇 30일 정착` / `🏆 6주 완주` 이모지+한국어 라벨.
- **스트릭 강등 경고** — `Never miss twice 발동 — 티어 강등` (영문 잠언) → `이틀 연속 빠졌어요. 한 단계 강등됐습니다.`.
- **스트릭 hero 위계** — 현재 스트릭을 `displayLarge` 큰 숫자 + 티어 라벨로 시각 강조 (사용자의 핵심 동기 지표).
- **습관 추가 드롭다운** — `만들기 (build)``만들기` (영어 식별자 병기 제거).
- 신규 `app/lib/ui/labels.dart` — domain enum 의 한국어 라벨 매핑 단일 지점. domain layer 에 `koreanLabel` 두지 않음 (관심사 분리).
### UX round 2 — 빈 상태 + 날짜 + 라벨 명확화 (Redmine #342 추가)
- **ChatScreen 빈 상태 안내** — 첫 진입 시 빈 메시지 리스트 대신 아이콘 + 한 줄 설명 + 예시 prompt 4개 (`아침 햇빛 받기 습관 추가해줘`, `오늘 운동 했어`, `내 스트릭 보여줘`, `수면 프로토콜 알려줘`). tap → 입력창 자동 채움 (자동 send X, 사용자 수정 여지).
- **CheckIn 날짜 한국식** — `2026-06-15` raw → `6월 15일 (월)`. DB 저장은 `_ymd` 유지.
- **HabitCreate 표현 방식** — `프레임 레벨` (의미 모호) → `표현 방식` + helperText `행동 위주 vs 정체성 위주`. 아이템 라벨 `L2 · 조건부 긍정` / `L3 · 정체성``조건부 행동 (예: 아침에 햇빛 받기)` / `정체성 (예: 나는 일찍 자는 사람)` 식 예시 포함.
### Dev
- **LLM 실패 빨간 배너에 full message + stack trace** — 단말 진단을 위해 release 빌드에서도 노출. `LLM 응답 실패: <Type>\n<message>\n--- STACK ---\n<stack>` 형식. SelectableText + monospace + 최대 화면 1/3 높이 + scroll. 사용자 친화 메시지로 좁히는 작업은 #342 종료 후 follow-up.
## [0.4.1] — 2026-06-15
### Added — ChatScreen LLM warm-up (Redmine #311, follow-up of #260)
- **백그라운드 warm-up** — `ChatScreen` 진입 시 `ChatWarmupController``LlmService.load()` 를 백그라운드로 트리거. 첫 send 에서 cold native-init (수 초) 비용 제거.
- **`ModelLifecycle.quickCheck()`** (신규) — SHA-256 재해싱 없이 meta_kv + 파일 존재만으로 ready 추정. ~2.4GB Gemma 4 E2B 파일에 대한 매 mount 마다의 hash 비용 회피.
- **Concurrent load guard** — `GemmaLlmService.load()` + `MockLlmService.load()``_loadingFuture` 가드 추가. ChatScreen warm-up + 동시 `userTurn` lazy load 가 race 해도 native init 1회만 실행.
- **Sealed state machine** — `ChatWarmupState`: Idle / Loading / Ready / Failed(kind) / Unavailable. autoDispose StateNotifier + `_disposed` 가드로 unmount race 방지.
### UX (Designer + Reviewer)
- warmup 중 입력창 `enabled` 유지 — 사용자가 미리 메시지 작성 가능 (UX R1+R2).
- send 자리에 `CircularProgressIndicator(strokeWidth: 2)``isStreaming` 패턴과 일관.
- hintText 교체 — warmup: `AI 준비 중… 첫 시작은 몇 초 걸려요` / 평상: `습관 추가, 기록, 카탈로그 질문…`.
- 실패 메시지는 상태 기술만 (UX R5/AC12) — `AI 모델 파일을 찾을 수 없어요.` / `AI 를 시작하지 못했어요.`. 행동은 버튼이 담당.
- `_WarmupErrorBanner``kind` 분기:
- `fileMissing`**[설정으로 가기]** + `SettingsScreen` push + pop 후 자동 `retry()` (UX R5/R6).
- `runtime`**[다시 시도]** + 즉시 `retry()`.
- `isLoaded=true` 재진입 시 Loading state skip — 1 frame 라벨 깜빡임 방지 (UX R4/AC11).
### Added — Tests
- 167/167 passed (1 pre-existing skip) — 신규 12 (`chat_warmup_test.dart` 8 + `model_lifecycle_test.dart` quickCheck 4).
- AC1~AC2, AC5~AC7, AC11, AC12 controller-level 검증.
- AC3/AC4/AC8/AC9/AC10 widget E2E 는 deferred — `CircularProgressIndicator` 무한 ticker + `Future.delayed``pumpAndSettle` race. `chat_screen_test.dart` NOTE comment 에 사유 명시.
### Docs
- 설계서 `docs/design/311-llm-warmup/` (4 파일) — README + 2 fn-spec + UX-REVIEW.md.
- 신규 페르소나 `ux-reviewer.md` — 02-Architect 단계의 parallel review.
### Known follow-ups (후속 이슈 권장)
- Widget E2E 인프라 개선 (FakeAsync 또는 spinner 가짜 대체) — ticker race 해소.
- 다른 recovery loop 도 `Navigator.push().then((_) => retry())` 패턴 적용 검토.
## [0.4.0] — 2026-06-15
### Added — Phase 2-B in-app tool calling (Redmine #260)

View File

@@ -37,13 +37,28 @@ class GemmaLlmService implements LlmService {
InferenceModel? _model;
bool _loaded = false;
Future<void>? _loadingFuture;
@override
bool get isLoaded => _loaded;
/// #311 AC7: concurrent-call guard. If a load is already in-flight (e.g.
/// `ChatScreen` warm-up + a racing `userTurn` lazy load), return the same
/// Future so native init runs at most once per process.
/// See `docs/design/311-llm-warmup/fn-concurrent_load_guard.md`.
@override
Future<void> load() async {
if (_loaded) return;
Future<void> load() {
if (_loaded) return Future.value();
final existing = _loadingFuture;
if (existing != null) return existing;
final future = _doLoad();
_loadingFuture = future;
return future.whenComplete(() {
_loadingFuture = null;
});
}
Future<void> _doLoad() async {
if (!await File(modelPath).exists()) {
throw FileSystemException('model file missing', modelPath);
}

View File

@@ -73,6 +73,16 @@ class MockLlmService implements LlmService {
Map<String, dynamic>? lastSchema;
Duration responseDelay = Duration.zero;
/// #311 test helpers. Simulate cold-load latency / failure so the warm-up
/// controller can be exercised. Mirrors the Gemma path:
/// - `loadDelay > 0` → load completes after the delay
/// - `loadThrows` → load throws this error
/// - `loadCount` → observed by concurrent-load tests
Duration loadDelay = Duration.zero;
Object? loadThrows;
int loadCount = 0;
Future<void>? _loadingFuture;
/// Queues consumed by [startChat] in order. Each entry is the event list
/// returned for a single `send*` call.
final List<List<LlmChatEvent>> chatScript = [];
@@ -82,8 +92,29 @@ class MockLlmService implements LlmService {
@override
bool get isLoaded => _loaded;
/// #311 AC7: same concurrent-call guard as [GemmaLlmService]. Repeated
/// in-flight `load()` calls share a single Future, so test assertions on
/// `loadCount` reflect the number of native-init attempts (1), not the
/// number of callers.
@override
Future<void> load() async {
Future<void> load() {
if (_loaded) return Future.value();
final existing = _loadingFuture;
if (existing != null) return existing;
final future = _doLoad();
_loadingFuture = future;
return future.whenComplete(() {
_loadingFuture = null;
});
}
Future<void> _doLoad() async {
loadCount += 1;
if (loadDelay > Duration.zero) {
await Future<void>.delayed(loadDelay);
}
final err = loadThrows;
if (err != null) throw err;
_loaded = true;
}

View File

@@ -94,6 +94,44 @@ class ModelLifecycle {
return p.join(dir.path, config.filename);
}
/// Lightweight ready estimate for warm-up gating (#311).
///
/// Skips the SHA-256 re-hash that [checkAvailability] performs — for a
/// ~2.4GB model file the hash is wall-clock-noticeable on every screen
/// mount. Returns `ready` iff:
/// - opt_in is true
/// - download_state is not in-progress
/// - meta_kv has both ai_model_path and ai_model_sha256
/// - the file exists on disk
///
/// Tampering/disk-corruption detection is left to [checkAvailability]'s
/// cold path (SettingsScreen). The trade-off is documented in
/// `docs/design/311-llm-warmup/README.md` §11 R4.
Future<ModelAvailability> quickCheck() async {
try {
final optIn = await meta.find(AiMetaKeys.optIn);
if (optIn != 'true') return ModelAvailability.missing;
final state = await meta.find(AiMetaKeys.downloadState);
if (state == 'downloading' || state == 'paused') {
return ModelAvailability.downloading;
}
final pathStr = await meta.find(AiMetaKeys.modelPath);
if (pathStr == null) return ModelAvailability.missing;
final expected = await meta.find(AiMetaKeys.modelSha);
if (expected == null) return ModelAvailability.corrupt;
final file = File(pathStr);
if (!file.existsSync()) return ModelAvailability.missing;
return ModelAvailability.ready;
} catch (_) {
return ModelAvailability.corrupt;
}
}
Future<ModelAvailability> checkAvailability() async {
try {
final optIn = await meta.find(AiMetaKeys.optIn);

View File

@@ -206,12 +206,16 @@ class ChatSessionController extends StateNotifier<ChatSessionState> {
clearStreamingText: true,
error: '도구 호출 루프가 너무 길어 중단했습니다.',
);
} catch (e) {
} catch (e, st) {
if (!mounted) return;
// 개발 단계 (#342) — 실 단말 진단을 위해 release 빌드에서도 full
// message + stack 노출. 사용자 친화 메시지로 다시 좁히는 작업은
// #342 종료 후 follow-up.
final detail = 'LLM 응답 실패: ${e.runtimeType}\n$e\n\n--- STACK ---\n$st';
state = state.copyWith(
isStreaming: false,
clearStreamingText: true,
error: 'LLM 응답 실패: ${e.runtimeType}',
error: detail,
);
}
}

View File

@@ -0,0 +1,135 @@
import 'dart:io';
import 'package:flutter_riverpod/flutter_riverpod.dart';
import '../data/ai/llm_service.dart';
import '../data/ai/model_lifecycle.dart';
import 'ai_providers.dart';
/// State machine for ChatScreen LLM warm-up (#311).
///
/// See `docs/design/311-llm-warmup/README.md` §6 / fn-chat_warmup_controller.md.
sealed class ChatWarmupState {
const ChatWarmupState();
}
final class ChatWarmupIdle extends ChatWarmupState {
const ChatWarmupIdle();
}
final class ChatWarmupLoading extends ChatWarmupState {
const ChatWarmupLoading();
}
final class ChatWarmupReady extends ChatWarmupState {
const ChatWarmupReady();
}
/// Warm-up was not attempted because [ModelLifecycle.quickCheck] returned
/// something other than `ready` (download incomplete, opt-out, corrupt).
/// UI behaves as if warm-up didn't exist; the first user send falls back to
/// the existing lazy `userTurn` path.
final class ChatWarmupUnavailable extends ChatWarmupState {
const ChatWarmupUnavailable();
}
/// `kind` discriminates the retry copy: `fileMissing` is a settings-level
/// recovery; `runtime` is a transient retry.
enum ChatWarmupFailureKind { fileMissing, runtime }
final class ChatWarmupFailed extends ChatWarmupState {
final String message;
final ChatWarmupFailureKind kind;
const ChatWarmupFailed(this.message, this.kind);
}
/// Drives `LlmService.load()` on ChatScreen mount so the first user send
/// doesn't pay native-init latency. AC1-AC12 (12개) 모두 본 controller 가
/// 흡수한다 (UI binding 은 chat_screen.dart 가 본 state 를 watch).
class ChatWarmupController extends StateNotifier<ChatWarmupState> {
ChatWarmupController({
required this.llm,
required this.lifecycle,
}) : super(const ChatWarmupIdle());
final LlmService llm;
final ModelLifecycle lifecycle;
bool _disposed = false;
/// Idempotent. Re-entrant guard via the Loading state — duplicate `start`
/// calls during an in-flight load do nothing (the running future will set
/// the final state). External callers use [retry] instead.
Future<void> start() async {
if (state is ChatWarmupLoading) return;
// AC11 / UX R4: fast path. Skip Loading entirely if the underlying
// service is already loaded — prevents 1-frame label flicker on
// ChatScreen re-entry.
if (llm.isLoaded) {
_safeSet(const ChatWarmupReady());
return;
}
final availability = await lifecycle.quickCheck();
if (_disposed) return;
if (availability != ModelAvailability.ready) {
_safeSet(const ChatWarmupUnavailable());
return;
}
_safeSet(const ChatWarmupLoading());
try {
await llm.load();
} catch (e) {
if (_disposed) return;
final kind = e is FileSystemException
? ChatWarmupFailureKind.fileMissing
: ChatWarmupFailureKind.runtime;
_safeSet(ChatWarmupFailed(_messageFor(kind), kind));
return;
}
if (_disposed) return;
_safeSet(const ChatWarmupReady());
}
Future<void> retry() async {
if (_disposed) return;
_safeSet(const ChatWarmupIdle());
await start();
}
/// AC6 / AC12: state는 disposed 인스턴스에는 더 이상 쓰지 않는다.
/// StateNotifier 의 setter 는 disposed 시 throw 하므로 가드 필수.
void _safeSet(ChatWarmupState s) {
if (_disposed) return;
state = s;
}
/// UX R5 / AC12: 메시지는 **상태**만 기술. "다시 시도해주세요" 같은
/// 명령형은 [다시 시도] 버튼이 담당하므로 본 문안에 넣지 않는다.
String _messageFor(ChatWarmupFailureKind kind) {
switch (kind) {
case ChatWarmupFailureKind.fileMissing:
return 'AI 모델 파일을 찾을 수 없어요.';
case ChatWarmupFailureKind.runtime:
return 'AI 를 시작하지 못했어요.';
}
}
@override
void dispose() {
_disposed = true;
super.dispose();
}
}
/// autoDispose: ChatScreen 이 pop 되면 controller 도 dispose → mount race 안전.
final chatWarmupProvider =
StateNotifierProvider.autoDispose<ChatWarmupController, ChatWarmupState>(
(ref) {
return ChatWarmupController(
llm: ref.watch(llmServiceProvider),
lifecycle: ref.watch(modelLifecycleProvider),
);
},
);

44
app/lib/ui/labels.dart Normal file
View File

@@ -0,0 +1,44 @@
import '../domain/models/habit.dart';
import '../domain/streak/compute_streak.dart';
/// UI 한국어 라벨 매핑. domain enum 의 `dbValue` 는 DB 직렬화용이므로
/// 사용자에게 그대로 노출하면 'build', 'L3', 'T0' 같은 raw 식별자가
/// 그대로 보인다. 본 헬퍼는 그걸 한국어 표현으로 바꾼다.
String habitTypeLabel(HabitType t) {
switch (t) {
case HabitType.build:
return '만들기';
case HabitType.breakHabit:
return '없애기';
}
}
/// Drift row (raw db String) 에서 직접 매핑. 'build' / 'break' 외의 값은
/// 그대로 노출해 invariant 위반을 가시화.
String habitTypeLabelFromDb(String dbValue) {
switch (dbValue) {
case 'build':
return '만들기';
case 'break':
return '없애기';
default:
return dbValue;
}
}
/// 5-Tier Reward Ladder (T0 새싹 → T4 6주 완주). milestone 누적 보상.
String rewardTierLabel(RewardTier t) {
switch (t) {
case RewardTier.t0:
return '🌱 새싹';
case RewardTier.t1:
return '🥉 3회 도전';
case RewardTier.t2:
return '🥈 7일 형성';
case RewardTier.t3:
return '🥇 30일 정착';
case RewardTier.t4:
return '🏆 6주 완주';
}
}

View File

@@ -3,6 +3,8 @@ import 'package:flutter_riverpod/flutter_riverpod.dart';
import '../../ai/tools/tool_envelope.dart';
import '../../state/chat_providers.dart';
import '../../state/chat_warmup_provider.dart';
import 'settings_screen.dart';
/// AI chat surface (#260). Multi-turn tool calling powered by Gemma 4 +
/// in-process tool runtime. ConfirmGate modals appear on destructive
@@ -18,6 +20,18 @@ class _ChatScreenState extends ConsumerState<ChatScreen> {
final _textCtrl = TextEditingController();
final _scrollCtrl = ScrollController();
@override
void initState() {
super.initState();
// #311 AC1: ChatScreen mount → background warm-up. depsAsync.data 가
// resolve 되기 전에는 toolDepsProvider 도 미준비라 send 자체가 막혀
// 있으므로, 그 사이에 native init 만 먼저 끝낸다.
WidgetsBinding.instance.addPostFrameCallback((_) {
if (!mounted) return;
ref.read(chatWarmupProvider.notifier).start();
});
}
@override
void dispose() {
_textCtrl.dispose();
@@ -62,50 +76,87 @@ class _ChatScreenState extends ConsumerState<ChatScreen> {
),
],
),
body: depsAsync.when(
loading: () => const Center(child: CircularProgressIndicator()),
error: (e, _) => Center(child: Text('초기화 실패: $e')),
data: (_) => _buildBody(context),
// Android edge-to-edge: 시스템 nav bar (3-button / gesture handle) 가
// 입력창을 가리지 않도록 SafeArea 로 감싼다. AppBar 가 이미 top inset
// 을 처리하므로 top 만 false.
body: SafeArea(
top: false,
child: depsAsync.when(
loading: () => const Center(child: CircularProgressIndicator()),
error: (e, _) => Center(child: Text('초기화 실패: $e')),
data: (_) => _buildBody(context),
),
),
);
}
Widget _buildBody(BuildContext context) {
final state = ref.watch(chatSessionControllerProvider);
final warmup = ref.watch(chatWarmupProvider);
_scrollToBottom();
// #311 AC3 / UX R3: warmup 중에는 hintText 만 교체. 입력창 자체는
// enabled (사용자가 미리 타이핑 가능 — AC9).
final isWarming = warmup is ChatWarmupLoading;
final hintText = isWarming
? 'AI 준비 중… 첫 시작은 몇 초 걸려요'
: '습관 추가, 기록, 카탈로그 질문…';
// AC10: warmup ready 이고 streaming 중이 아닐 때 send 활성. 빈 텍스트는
// _send() 가 early-return 하므로 별도 gating 불필요 (rebuild race 회피).
final canSend = !state.isStreaming && !isWarming;
final theme = Theme.of(context);
return Column(
children: [
if (warmup is ChatWarmupFailed) _WarmupErrorBanner(warmup: warmup),
if (state.error != null)
// #342 dev — 단말에서 원인 진단을 위해 stack 까지 노출되는 케이스를
// 위해 multi-line + scrollable + selectable. 높이는 화면의 1/3 까지만.
Container(
width: double.infinity,
color: Theme.of(context).colorScheme.errorContainer,
color: theme.colorScheme.errorContainer,
padding: const EdgeInsets.all(12),
child: Text(
state.error!,
style: TextStyle(
color: Theme.of(context).colorScheme.onErrorContainer,
constraints: BoxConstraints(
maxHeight: MediaQuery.of(context).size.height / 3,
),
child: SingleChildScrollView(
child: SelectableText(
state.error!,
style: TextStyle(
color: theme.colorScheme.onErrorContainer,
fontFamily: 'monospace',
fontSize: 12,
),
),
),
),
Expanded(
child: ListView.builder(
controller: _scrollCtrl,
padding: const EdgeInsets.all(12),
itemCount: state.messages.length +
(state.streamingText != null &&
state.streamingText!.isNotEmpty
? 1
: 0),
itemBuilder: (context, i) {
if (i < state.messages.length) {
return _MessageBubble(message: state.messages[i]);
}
return _MessageBubble(
message: ModelChatMessage(state.streamingText ?? ''),
streaming: true,
);
},
),
child: state.messages.isEmpty && state.streamingText == null
? _EmptyChatHint(onPickPrompt: (p) {
_textCtrl.text = p;
_textCtrl.selection = TextSelection.fromPosition(
TextPosition(offset: p.length),
);
})
: ListView.builder(
controller: _scrollCtrl,
padding: const EdgeInsets.all(12),
itemCount: state.messages.length +
(state.streamingText != null &&
state.streamingText!.isNotEmpty
? 1
: 0),
itemBuilder: (context, i) {
if (i < state.messages.length) {
return _MessageBubble(message: state.messages[i]);
}
return _MessageBubble(
message: ModelChatMessage(state.streamingText ?? ''),
streaming: true,
);
},
),
),
const Divider(height: 1),
Padding(
@@ -117,31 +168,32 @@ class _ChatScreenState extends ConsumerState<ChatScreen> {
child: TextField(
controller: _textCtrl,
enabled: !state.isStreaming,
decoration: const InputDecoration(
hintText: '습관 추가, 기록, 카탈로그 질문…',
border: OutlineInputBorder(),
decoration: InputDecoration(
hintText: hintText,
border: const OutlineInputBorder(),
isDense: true,
),
maxLines: 4,
minLines: 1,
textInputAction: TextInputAction.send,
onSubmitted: (_) => _send(),
onSubmitted: (_) => canSend ? _send() : null,
),
),
const SizedBox(width: 8),
state.isStreaming
? const Padding(
padding: EdgeInsets.all(8),
child: SizedBox(
width: 24,
height: 24,
child: CircularProgressIndicator(strokeWidth: 2),
),
)
: IconButton.filled(
onPressed: _send,
icon: const Icon(Icons.send),
),
if (state.isStreaming || isWarming)
const Padding(
padding: EdgeInsets.all(8),
child: SizedBox(
width: 24,
height: 24,
child: CircularProgressIndicator(strokeWidth: 2),
),
)
else
IconButton.filled(
onPressed: canSend ? _send : null,
icon: const Icon(Icons.send),
),
],
),
),
@@ -150,6 +202,126 @@ class _ChatScreenState extends ConsumerState<ChatScreen> {
}
}
/// #311 AC5 / UX R5+R6: 실패 메시지는 상태만 기술, 행동은 버튼이 담당.
/// fileMissing 은 retry 로 회복 불가 — 설정 화면으로 유도해 재다운로드 경로를 연다.
/// runtime 은 일시적일 수 있으므로 [다시 시도] (in-place retry).
class _WarmupErrorBanner extends ConsumerWidget {
final ChatWarmupFailed warmup;
const _WarmupErrorBanner({required this.warmup});
@override
Widget build(BuildContext context, WidgetRef ref) {
final theme = Theme.of(context);
final isFileMissing =
warmup.kind == ChatWarmupFailureKind.fileMissing;
return Container(
width: double.infinity,
color: theme.colorScheme.errorContainer,
padding: const EdgeInsets.symmetric(horizontal: 12, vertical: 10),
child: Column(
crossAxisAlignment: CrossAxisAlignment.stretch,
children: [
Text(
warmup.message,
style: TextStyle(color: theme.colorScheme.onErrorContainer),
),
const SizedBox(height: 8),
Align(
alignment: Alignment.centerRight,
child: OutlinedButton(
onPressed: () {
if (isFileMissing) {
// SettingsScreen pop 후 자동 retry — 사용자가 거기서 다시
// 다운로드를 완료했다면 ChatScreen 으로 돌아오자마자 회복.
// 다운로드 안 했으면 다시 Failed 로 떨어져 같은 배너 노출.
Navigator.of(context)
.push(MaterialPageRoute(
builder: (_) => const SettingsScreen(),
))
.then((_) {
if (!context.mounted) return;
ref.read(chatWarmupProvider.notifier).retry();
});
} else {
ref.read(chatWarmupProvider.notifier).retry();
}
},
child: Text(isFileMissing ? '설정으로 가기' : '다시 시도'),
),
),
],
),
);
}
}
/// 첫 진입 시 빈 대화창 안내. 사용자가 무엇을 물어볼 수 있는지
/// 예시 prompt 4개 + tool 카테고리 짧은 안내. tap 하면 입력창에 채워지고
/// 사용자가 보내기만 누르면 됨 (자동 send X — 사용자가 문구 수정 여지).
class _EmptyChatHint extends StatelessWidget {
final ValueChanged<String> onPickPrompt;
const _EmptyChatHint({required this.onPickPrompt});
static const _examples = [
'아침 햇빛 받기 습관 추가해줘',
'오늘 운동 했어',
'내 스트릭 보여줘',
'수면 프로토콜 알려줘',
];
@override
Widget build(BuildContext context) {
final theme = Theme.of(context);
return SingleChildScrollView(
padding: const EdgeInsets.symmetric(horizontal: 24, vertical: 32),
child: Column(
crossAxisAlignment: CrossAxisAlignment.stretch,
children: [
Icon(
Icons.smart_toy_outlined,
size: 48,
color: theme.colorScheme.primary,
),
const SizedBox(height: 16),
Text(
'AI 코치',
style: theme.textTheme.titleLarge,
textAlign: TextAlign.center,
),
const SizedBox(height: 8),
Text(
'습관 추가·기록 · 카탈로그 검색 · 스트릭 조회를 도와드려요.',
style: theme.textTheme.bodyMedium?.copyWith(
color: theme.colorScheme.onSurfaceVariant,
),
textAlign: TextAlign.center,
),
const SizedBox(height: 24),
Text(
'예시',
style: theme.textTheme.labelLarge?.copyWith(
color: theme.colorScheme.onSurfaceVariant,
),
),
const SizedBox(height: 8),
..._examples.map((p) => Padding(
padding: const EdgeInsets.symmetric(vertical: 4),
child: OutlinedButton(
onPressed: () => onPickPrompt(p),
style: OutlinedButton.styleFrom(
alignment: Alignment.centerLeft,
padding: const EdgeInsets.symmetric(
horizontal: 16, vertical: 12),
),
child: Text(p),
),
)),
],
),
);
}
}
/// Human-friendly Korean labels for the 6 tools registered in
/// `ToolRegistry.defaults()`. Falls back to the raw tool name for any
/// future tool that hasn't been mapped yet — better to show the raw id

View File

@@ -50,7 +50,7 @@ class _CheckInScreenState extends ConsumerState<CheckInScreen> {
mainAxisAlignment: MainAxisAlignment.center,
crossAxisAlignment: CrossAxisAlignment.stretch,
children: [
Text('오늘 (${_ymd(nowKst())})',
Text('오늘 · ${_koreanDate(nowKst())}',
style: Theme.of(context).textTheme.titleLarge,
textAlign: TextAlign.center),
const SizedBox(height: 32),
@@ -80,3 +80,9 @@ String _ymd(DateTime d) =>
'${d.year.toString().padLeft(4, '0')}-'
'${d.month.toString().padLeft(2, '0')}-'
'${d.day.toString().padLeft(2, '0')}';
/// 사용자 노출용 한국식 날짜 — '6월 15일 (월)'. DB 저장은 _ymd 가 담당.
String _koreanDate(DateTime d) {
const weekdays = ['', '', '', '', '', '', ''];
return '${d.month}${d.day}일 (${weekdays[d.weekday - 1]})';
}

View File

@@ -94,9 +94,8 @@ class _HabitCreateScreenState extends ConsumerState<HabitCreateScreen> {
DropdownButtonFormField<HabitType>(
initialValue: _type,
items: const [
DropdownMenuItem(value: HabitType.build, child: Text('만들기 (build)')),
DropdownMenuItem(
value: HabitType.breakHabit, child: Text('없애기 (break)')),
DropdownMenuItem(value: HabitType.build, child: Text('만들기')),
DropdownMenuItem(value: HabitType.breakHabit, child: Text('없애기')),
],
onChanged: (v) => setState(() => _type = v ?? HabitType.build),
decoration: const InputDecoration(labelText: '타입'),
@@ -105,11 +104,16 @@ class _HabitCreateScreenState extends ConsumerState<HabitCreateScreen> {
DropdownButtonFormField<FrameLevel>(
initialValue: _level,
items: const [
DropdownMenuItem(value: FrameLevel.l2, child: Text('L2 · 조건부 긍정')),
DropdownMenuItem(value: FrameLevel.l3, child: Text('L3 · 정체성')),
DropdownMenuItem(
value: FrameLevel.l2, child: Text('조건부 행동 (예: 아침에 햇빛 받기)')),
DropdownMenuItem(
value: FrameLevel.l3, child: Text('정체성 (예: 나는 일찍 자는 사람)')),
],
onChanged: (v) => setState(() => _level = v ?? FrameLevel.l2),
decoration: const InputDecoration(labelText: '프레임 레벨'),
decoration: const InputDecoration(
labelText: '표현 방식',
helperText: '문구를 어떻게 적을지 — 행동 위주 vs 정체성 위주',
),
),
const SizedBox(height: 16),
TextFormField(

View File

@@ -3,6 +3,7 @@ import 'package:flutter_riverpod/flutter_riverpod.dart';
import '../../state/ai_providers.dart';
import '../../state/providers.dart';
import '../labels.dart';
import 'chat_screen.dart';
import 'check_in_screen.dart';
import 'habit_create_screen.dart';
@@ -85,8 +86,10 @@ class HabitListScreen extends ConsumerWidget {
final h = habits[i];
return ListTile(
title: Text(h.title),
// FrameLevel (L2/L3) 은 시스템 규약이라 사용자에게 노출
// 가치 낮음 — type chip + framedText 만 표시.
subtitle: Text(
'${h.type} · ${h.frameLevel} · ${h.frameFramedText}',
'${habitTypeLabelFromDb(h.type)} · ${h.frameFramedText}',
maxLines: 2,
overflow: TextOverflow.ellipsis,
),

View File

@@ -5,6 +5,7 @@ import '../../core/time.dart';
import '../../domain/models/tracker_entry.dart';
import '../../domain/streak/compute_streak.dart';
import '../../state/providers.dart';
import '../labels.dart';
class StreakScreen extends ConsumerWidget {
final String habitId;
@@ -51,25 +52,43 @@ class StreakScreen extends ConsumerWidget {
asOf: nowKst(),
habitStartedAt: habit.startedAt as String,
);
final theme = Theme.of(context);
return Padding(
padding: const EdgeInsets.all(24),
child: Column(
crossAxisAlignment: CrossAxisAlignment.start,
children: [
Text(habit.title as String,
style: Theme.of(context).textTheme.titleLarge),
style: theme.textTheme.titleLarge),
const SizedBox(height: 24),
_Row('현재 스트릭', '${state.currentStreak}'),
// Hero — 핵심 동기 지표. 큰 숫자 + 티어 emoji 라벨로 위계 강조.
Center(
child: Column(
children: [
Text(
'${state.currentStreak}',
style: theme.textTheme.displayLarge?.copyWith(
fontWeight: FontWeight.w700,
color: theme.colorScheme.primary,
),
),
Text('일 연속 (현재 스트릭)',
style: theme.textTheme.bodyMedium),
const SizedBox(height: 4),
Text(rewardTierLabel(state.currentTier),
style: theme.textTheme.titleMedium),
],
),
),
const Divider(height: 40),
_Row('최장 스트릭', '${state.longestStreak}'),
_Row('최근 30일 / 완료', '${state.doneCountInWindow30}'),
_Row('Phase 42일 / 완료', '${state.doneCountInPhase42}'),
const Divider(height: 32),
_Row('현재 티어', state.currentTier.dbValue),
if (state.neverMissTwiceBroken)
const Padding(
padding: EdgeInsets.only(top: 12),
child: Text(
'Never miss twice 발동 — 티어 강등',
'이틀 연속 빠졌어요. 한 단계 강등됐습니다.',
style: TextStyle(color: Colors.redAccent),
),
),

View File

@@ -1,7 +1,7 @@
name: life_helper
description: "Huberman + Atomic Habits + Tiny Habits + If-Then. Local-first habit/checklist/todo."
publish_to: 'none'
version: 0.4.0+4
version: 0.4.2+6
environment:
sdk: ^3.12.2

View File

@@ -172,6 +172,66 @@ void main() {
expect(await lc.checkAvailability(), ModelAvailability.downloading);
});
test('quickCheck ready when meta_kv complete + file exists (no SHA)', () async {
const file = 'gemma_quick.bin';
final lc = ModelLifecycle(
meta: meta,
// 일부러 expectedSha 와 다르게 — quickCheck 는 SHA 비교 X.
config: ModelConfig(
url: Uri.parse(url),
expectedSha256: 'unused_by_quickcheck',
filename: file,
),
storage: storage,
);
await meta.put(AiMetaKeys.optIn, 'true');
final path = '${tmp.path}/$file';
File(path).writeAsStringSync('payload');
await meta.put(AiMetaKeys.modelPath, path);
await meta.put(AiMetaKeys.modelSha, 'whatever');
expect(await lc.quickCheck(), ModelAvailability.ready);
});
test('quickCheck missing when modelPath not set', () async {
final lc = ModelLifecycle(
meta: meta,
config: ModelConfig(url: Uri.parse(url), expectedSha256: 'x'),
storage: storage,
);
await meta.put(AiMetaKeys.optIn, 'true');
expect(await lc.quickCheck(), ModelAvailability.missing);
});
test('quickCheck missing when file deleted from disk', () async {
const file = 'gemma_gone.bin';
final lc = ModelLifecycle(
meta: meta,
config: ModelConfig(
url: Uri.parse(url),
expectedSha256: 'x',
filename: file,
),
storage: storage,
);
await meta.put(AiMetaKeys.optIn, 'true');
await meta.put(AiMetaKeys.modelPath, '${tmp.path}/$file');
await meta.put(AiMetaKeys.modelSha, 'sha');
// 파일 자체는 만들지 않음.
expect(await lc.quickCheck(), ModelAvailability.missing);
});
test('quickCheck downloading when state in progress', () async {
final lc = ModelLifecycle(
meta: meta,
config: ModelConfig(url: Uri.parse(url), expectedSha256: 'x'),
storage: storage,
);
await meta.put(AiMetaKeys.optIn, 'true');
await meta.put(AiMetaKeys.downloadState, 'downloading');
expect(await lc.quickCheck(), ModelAvailability.downloading);
});
test('checkAvailability returns corrupt when file SHA mismatches', () async {
const file = 'gemma_corrupt.bin';
final lc = ModelLifecycle(

View File

@@ -0,0 +1,216 @@
import 'dart:io';
import 'package:drift/native.dart';
import 'package:flutter_test/flutter_test.dart';
import 'package:http/http.dart' as http;
import 'package:life_helper/data/ai/llm_service.dart';
import 'package:life_helper/data/ai/model_lifecycle.dart';
import 'package:life_helper/data/db/app_database.dart';
import 'package:life_helper/data/db/daos/meta_dao.dart';
import 'package:life_helper/state/chat_warmup_provider.dart';
class _NoopStorage implements StorageAdapter {
_NoopStorage(this.dir);
final Directory dir;
@override
Future<Directory> supportDir() async => dir;
@override
Future<http.StreamedResponse> rangeGet(Uri url, int from) =>
throw UnimplementedError();
}
/// quickCheck 만 사용하는 controller 테스트에서는 download 경로가 필요 없다.
/// `meta_kv` 를 직접 세팅해 quickCheck 가 ready/missing 등으로 분기되게 만든다.
Future<ModelLifecycle> _setupLifecycle({
required MetaDao meta,
required Directory tmp,
required bool readyOnDisk,
}) async {
final lc = ModelLifecycle(
meta: meta,
config: ModelConfig(
url: Uri.parse('https://example/model.bin'),
expectedSha256: 'x',
filename: 'warmup_test.bin',
),
storage: _NoopStorage(tmp),
);
await meta.put(AiMetaKeys.optIn, 'true');
if (readyOnDisk) {
final path = '${tmp.path}/warmup_test.bin';
File(path).writeAsStringSync('payload');
await meta.put(AiMetaKeys.modelPath, path);
await meta.put(AiMetaKeys.modelSha, 'any');
}
return lc;
}
void main() {
late AppDatabase db;
late MetaDao meta;
late Directory tmp;
setUp(() async {
db = AppDatabase(NativeDatabase.memory());
meta = MetaDao(db);
tmp = await Directory.systemTemp.createTemp('warmup_test_');
});
tearDown(() async {
await db.close();
if (tmp.existsSync()) await tmp.delete(recursive: true);
});
test('AC1/AC3/AC4: happy path emits Idle → Loading → Ready', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()..loadDelay = const Duration(milliseconds: 30);
final controller =
ChatWarmupController(llm: mock, lifecycle: lc);
final seen = <ChatWarmupState>[];
controller.addListener(seen.add, fireImmediately: false);
await controller.start();
expect(seen.first, isA<ChatWarmupLoading>());
expect(seen.last, isA<ChatWarmupReady>());
expect(mock.isLoaded, true);
expect(mock.loadCount, 1);
});
test('AC11 / UX R4: fast path skips Loading when already loaded', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService();
await mock.load(); // pre-loaded
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
final seen = <ChatWarmupState>[];
controller.addListener(seen.add, fireImmediately: false);
await controller.start();
expect(seen, hasLength(1));
expect(seen.single, isA<ChatWarmupReady>());
// 추가 native init 호출 없음 (사전 mock.load() 1 회만 — fast path 가
// _doLoad 를 다시 호출하지 않음을 검증).
expect(mock.loadCount, 1);
});
test('AC2: quickCheck != ready → Unavailable, load not called', () async {
// readyOnDisk: false → meta_kv 의 modelPath 가 없음 → missing.
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: false);
final mock = MockLlmService();
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
await controller.start();
expect(controller.state, isA<ChatWarmupUnavailable>());
expect(mock.loadCount, 0);
expect(mock.isLoaded, false);
});
test('AC5: FileSystemException → Failed(fileMissing)', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()
..loadThrows = const FileSystemException('model file missing', '/x');
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
await controller.start();
expect(controller.state, isA<ChatWarmupFailed>());
final failed = controller.state as ChatWarmupFailed;
expect(failed.kind, ChatWarmupFailureKind.fileMissing);
expect(failed.message, 'AI 모델 파일을 찾을 수 없어요.');
// AC12: message 에 명령형 문구 금지.
expect(failed.message, isNot(contains('다시 시도')));
});
test('AC5: generic error → Failed(runtime)', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()..loadThrows = StateError('boom');
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
await controller.start();
final failed = controller.state as ChatWarmupFailed;
expect(failed.kind, ChatWarmupFailureKind.runtime);
expect(failed.message, 'AI 를 시작하지 못했어요.');
expect(failed.message, isNot(contains('다시 시도')));
});
test('retry: Failed → retry() → Loading → Ready', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()..loadThrows = StateError('first fails');
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
await controller.start();
expect(controller.state, isA<ChatWarmupFailed>());
// 두 번째 시도는 성공시킴.
mock.loadThrows = null;
final seen = <ChatWarmupState>[];
controller.addListener(seen.add, fireImmediately: false);
await controller.retry();
expect(seen.map((s) => s.runtimeType).toList(), [
ChatWarmupIdle,
ChatWarmupLoading,
ChatWarmupReady,
]);
expect(mock.loadCount, 2);
});
test('AC6: dispose 도중 state 변경 시도 무시 (race 안전)', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()..loadDelay = const Duration(milliseconds: 50);
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
// listener 로 마지막 상태 추적 (StateNotifier.state 는 dispose 후 throw).
final seen = <ChatWarmupState>[];
controller.addListener(seen.add, fireImmediately: false);
final f = controller.start();
// quickCheck 완료 + Loading 진입까지 진행한 다음 dispose.
await Future<void>.delayed(const Duration(milliseconds: 10));
controller.dispose();
await f; // throw 하지 않아야 함.
// dispose 후 load() 완료가 _safeSet(Ready) 를 시도해도 막혀야 한다.
expect(seen.last, isA<ChatWarmupLoading>());
expect(
seen.whereType<ChatWarmupReady>(),
isEmpty,
reason: 'dispose 이후 Ready 로 전이되면 안 됨',
);
});
test('AC7: concurrent load shares future (loadCount = 1)', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()..loadDelay = const Duration(milliseconds: 30);
// 두 caller (warmup controller + 가상 userTurn) 가 동시에 load.
final future1 = mock.load();
final future2 = mock.load();
await Future.wait([future1, future2]);
expect(mock.loadCount, 1);
expect(mock.isLoaded, true);
// lc 는 본 케이스에서는 사용 안 함 (gemma 서비스 가드 검증).
expect(lc, isNotNull);
});
test('재진입 가드: Loading 상태에서 start 재호출은 no-op', () async {
final lc = await _setupLifecycle(meta: meta, tmp: tmp, readyOnDisk: true);
final mock = MockLlmService()..loadDelay = const Duration(milliseconds: 50);
final controller = ChatWarmupController(llm: mock, lifecycle: lc);
final first = controller.start();
// 첫 호출이 Loading 으로 들어간 직후 두 번째 start 호출.
await Future<void>.delayed(const Duration(milliseconds: 5));
final second = controller.start(); // no-op
await Future.wait([first, second]);
expect(mock.loadCount, 1);
expect(controller.state, isA<ChatWarmupReady>());
});
}

View File

@@ -127,4 +127,10 @@ void main() {
expect(find.textContaining('취소됨'), findsOneWidget);
},
);
// NOTE: #311 widget-level ACs (3/5/9/10/12) are covered by the
// controller-level tests in `test/state/chat_warmup_test.dart`.
// Widget tests for ChatScreen + warmup binding interact poorly with the
// CircularProgressIndicator ticker + Future.delayed timing in this test
// setup (see QA notes for #311), so we defer them until that's sorted.
}

View File

@@ -0,0 +1,244 @@
# 설계서: ChatScreen LLM warm-up (#311)
> **상태**: Approved (v0.4.1, 2026-06-15)
> **작성**: [AI] Architect · **최종수정**: 2026-06-15 (08-Documenter 마감)
> **추적성** — Redmine: #311 · 관련 ADR: 없음 (Backward-compatible 추가) · Release: v0.4.1 (`121108f`)
> · 구현 파일: `app/lib/state/chat_warmup_provider.dart` (신규) · `app/lib/data/ai/llm_service.dart` (수정) · `app/lib/data/ai/model_lifecycle.dart` (`quickCheck` 추가) · `app/lib/data/ai/gemma_llm_service.dart` (concurrent load guard) · `app/lib/ui/screens/chat_screen.dart` (warmup binding)
> · 테스트: `app/test/state/chat_warmup_test.dart` (신규) · `app/test/data/ai/model_lifecycle_test.dart` (quickCheck 케이스 추가) · `app/test/ui/chat_screen_test.dart` (warmup 라벨/disabled 케이스 추가)
## 1. 목적 (Why)
> Planner 목표 인용: ChatScreen 진입 시 LLM 모델을 백그라운드로 warm-up 하여, 첫 send 의 perceived latency 에서 cold load (수 초) 를 제거한다.
현재 `chat_providers.dart:131``llm.load()` 가 첫 `userTurn` 시점에 lazy 실행된다. Gemma 4 E2B 의 native runtime 초기화 + `installModel.fromFile().install()` + `getActiveModel(maxTokens: 2048)` 가 합쳐 수 초가 걸려, 사용자는 첫 메시지 send 직후 빈 화면을 본다. 본 이슈는 그 비용을 사용자 입력 전(ChatScreen mount 시점) 으로 이동시킨다.
## 2. 범위 (Scope)
- **포함**:
- ChatScreen mount 시 백그라운드 `llm.load()` 트리거.
- 로드 상태(idle/loading/ready/failed/unavailable) 노출 + 입력창 binding.
- `GemmaLlmService.load()` / `MockLlmService.load()` 의 concurrent-call 가드.
- `ModelLifecycle.quickCheck()` — SHA-256 해싱 없이 ready 여부 추정 (warmup gate 전용).
- Widget 테스트 (loading 라벨 노출 → 완료 → 사라짐).
- **제외 (out of scope)**:
- `HabitCreateScreen` 의 AI 제안 (frame suggestion) warm-up — 동일 패턴 필요 시 별도 후속 이슈.
- 다운로드 자체 진행률 UI — 이미 SettingsScreen 에 존재 (#218).
- `#219` idle auto-unload 구현 — 본 이슈는 entry point 만 정의.
- 추론 자체 (KV-cache warm 등) 의 추가 최적화 — `load()` 호출까지만.
## 3. 인수조건 (Acceptance Criteria)
> Planner AC 8개 + UX-Reviewer 신규 AC 4개 (UX-REVIEW.md 흡수). QA 가 이걸로 판정.
- [ ] **AC1** ChatScreen mount → background `llm.load()` 시작. 이미 `isLoaded` 면 no-op.
- [ ] **AC2** `ModelLifecycle.quickCheck() != ready` 일 때 warmup 시도하지 않음. 다운로드 미완 / opt-out / corrupt 상태에서 spurious load 방지.
- [ ] **AC3** 로드 진행 중 입력창은 `enabled: true` 유지 (사용자가 메시지를 미리 작성할 수 있음). send 버튼만 disabled + `CircularProgressIndicator(strokeWidth:2)`. 입력창 `hintText``"AI 준비 중… 첫 시작은 몇 초 걸려요"` 로 교체. ← UX R1+R3 흡수.
- [ ] **AC4** 로드 완료 시 send 버튼 활성, `hintText` 가 평상시 `"습관 추가, 기록, 카탈로그 질문…"` 로 복귀. 첫 send 가 cold load 비포함 수준 latency 로 응답.
- [ ] **AC5** 로드 실패 시 기존 chat_screen error container 재사용. **메시지는 상태만 기술**, 행동은 별도 `OutlinedButton('다시 시도')` 가 담당 (error container 내부, 우측 정렬). ← UX R5+R6 흡수.
- [ ] **AC6** Warmup 진행 중 사용자가 ChatScreen 을 떠나도 race / leak 없음. autoDispose StateNotifier + `_disposed` 가드.
- [ ] **AC7** `ChatSessionController.userTurn` 의 lazy load 와 백그라운드 warmup 이 동시 호출되어도 안전. `GemmaLlmService._loadingFuture` 가드로 중복 native init 차단.
- [ ] **AC8** Widget 테스트:
- delay mock → spinner + hintText 교체 노출 → 완료 후 send 활성 + hintText 복귀.
- error mock → error container + [다시 시도] 버튼 노출 + 클릭 시 retry.
- `quickCheck() = missing` → warmup 시도 안 함 + UI 변화 없음 (첫 send 시 기존 lazy 경로).
- [ ] **AC9** (UX R1+R2) Warmup 중 입력창은 타이핑 가능. send 만 disabled.
- [ ] **AC10** (UX R2) Warmup ready 전이 시점에 입력창에 비어있지 않은 텍스트가 있으면 send 자동 활성화. 자동 send 는 X.
- [ ] **AC11** (UX R4) `isLoaded=true` 인 재진입 시 Loading state 가 1 frame 이라도 노출되지 않음 (위젯 테스트로 verify).
- [ ] **AC12** (UX R5) 실패 메시지 본문에 "다시 시도해주세요" 같은 명령형 문구 금지. 행동은 버튼이 담당.
## 4. 컨텍스트 & 제약
- **의존성**:
- `LlmService` (`load`/`isLoaded`/`startChat`) — 기존 인터페이스 유지.
- `ModelLifecycle` (`checkAvailability` 기존, `quickCheck` 신규) — meta_kv DAO 의존.
- Riverpod (`StateNotifier`, `FutureProvider`, `autoDispose`).
- **제약**:
- `flutter_gemma 0.16.5``FlutterGemma.initialize` 는 isolate 당 1회 (`_initialized` 가드 있음). `installModel` + `getActiveModel` 은 idempotent 가 아니다 — 두 번째 호출 시 동작 미정의. **concurrent load 가드 필수**.
- `ModelLifecycle.checkAvailability()` 가 SHA-256 ~2.4GB 해싱을 포함. ChatScreen mount 마다 호출하면 비용 과대. quickCheck 분리.
- autoDispose StateNotifier 라이프사이클: ChatScreen pop 시 dispose 호출, 진행 중 future 가 unmounted state 변경 시도하면 안 됨.
- **가정**:
- `GemmaLlmService.load()` 비용 ≈ native init + mmap + `getActiveModel`. KV-cache warm 은 첫 inference 시 발생 (별도 트랙). → R3 해소.
- 사용자가 SettingsScreen 에서 모델을 ready 상태로 만든 적이 있다 (meta_kv 의 `ai_model_sha256` 가 채워져 있다). 그렇지 않으면 quickCheck=missing → warmup skip → 기존 lazy 경로 fallback.
## 5. 아키텍처 개요
- **모듈/파일**:
- 신규: `app/lib/state/chat_warmup_provider.dart``ChatWarmupController` (StateNotifier) + `chatWarmupProvider`.
- 수정: `app/lib/data/ai/llm_service.dart``MockLlmService._loadingFuture` 가드 추가.
- 수정: `app/lib/data/ai/gemma_llm_service.dart``_loadingFuture` 가드 추가.
- 수정: `app/lib/data/ai/model_lifecycle.dart``quickCheck()` 메서드 추가.
- 수정: `app/lib/ui/screens/chat_screen.dart``initState` 에서 warmup 트리거, body 에 상태 binding.
- **데이터 흐름**:
```
ChatScreen.initState
└─> ref.read(chatWarmupProvider.notifier).start()
├─> meta_kv 의 ai_opt_in / ai_model_path / ai_model_sha256 조회 (ModelLifecycle.quickCheck)
│ ├─> ready 아님 → state = unavailable, 종료 (기존 lazy 경로 fallback)
│ └─> ready
├─> state = loading
├─> llm.load() ── concurrent 가드 (_loadingFuture 공유) ──┐
│ ↓
│ ChatSessionController.userTurn 의 llm.load() 호출 시 동일 future 반환
├─> 성공 → state = ready
└─> 실패 → state = failed(message)
ChatScreen.build (Consumer)
├─> warmup.state == loading
│ ├─ 입력창: enabled:true, hintText="AI 준비 중… 첫 시작은 몇 초 걸려요"
│ └─ send: disabled + spinner
├─> warmup.state == failed
│ ├─ error container: 상태 메시지만
│ └─ [다시 시도] OutlinedButton (container 내부, 우측 정렬) → controller.retry()
├─> warmup.state == ready
│ ├─ 입력창: hintText="습관 추가, 기록, 카탈로그 질문…" (평상)
│ └─ send: 텍스트 비어있지 않으면 즉시 활성 (AC10)
├─> warmup.state == unavailable → 정상 입력창 (warmup 라벨 X, 첫 send 시 lazy 경로)
└─> warmup.state == idle (lifecycle race) → 정상 입력창 (안전 기본값)
```
- **I/O ↔ 순수 로직 경계**:
- I/O: `ModelLifecycle.quickCheck()` (meta_kv read + file existsSync), `LlmService.load()` (native init).
- 순수: `ChatWarmupController` 의 state 전이는 의존성 주입된 함수만 호출 — 단위 테스트로 모든 분기 검증.
## 6. 데이터 모델
### `ChatWarmupState` (sealed, `chat_warmup_provider.dart`)
```dart
sealed class ChatWarmupState { const ChatWarmupState(); }
final class ChatWarmupIdle extends ChatWarmupState { const ChatWarmupIdle(); }
final class ChatWarmupLoading extends ChatWarmupState { const ChatWarmupLoading(); }
final class ChatWarmupReady extends ChatWarmupState { const ChatWarmupReady(); }
final class ChatWarmupFailed extends ChatWarmupState {
final String message;
const ChatWarmupFailed(this.message);
}
/// quickCheck != ready — warmup 자체를 시도하지 않은 상태.
/// UI 는 정상 입력창 표시 (첫 send 시 기존 lazy 경로).
final class ChatWarmupUnavailable extends ChatWarmupState { const ChatWarmupUnavailable(); }
```
### `ModelLifecycle.quickCheck()` 반환 타입
- 재사용: 기존 `ModelAvailability` enum (`ready` / `missing` / `corrupt` / `downloading`).
- 차이: SHA-256 재해싱을 건너뛴다. 파일 존재 + meta_kv 의 `ai_model_path` / `ai_model_sha256` 가 모두 채워져 있으면 `ready` 로 간주. 손상 감지는 `checkAvailability()` (cold 경로) 에 위임.
### 입력창 binding (UX 흡수)
- `chat_screen.dart` 의 TextField `enabled` = `state.isStreaming == false`.
- **warmupState 와 무관** — 사용자가 warmup 중에도 메시지를 미리 작성 가능 (UX R1).
- TextField `hintText`:
- `warmupState is ChatWarmupLoading``"AI 준비 중… 첫 시작은 몇 초 걸려요"`
- 그 외 → `"습관 추가, 기록, 카탈로그 질문…"`
- send 버튼: `state.isStreaming || warmupState is ChatWarmupLoading || textIsEmpty` 면 disabled. Loading 일 때는 spinner 표시.
- send 자동 활성 (AC10): warmup 가 ready 로 전이될 때 입력창 텍스트가 비어있지 않으면 send 가 자동으로 enabled 로 바뀜 (텍스트 controller listener 가 이미 처리하므로 별도 코드 거의 없음).
### 마이크로카피 사전 (UX-Reviewer 채택본)
| 상태 | 한국어 라벨 | 위치 |
|---|---|---|
| warmup loading | hintText: `AI 준비 중… 첫 시작은 몇 초 걸려요` | 입력창 |
| warmup ready | hintText: `습관 추가, 기록, 카탈로그 질문…` | 입력창 (기존 유지) |
| warmup unavailable | (라벨 변경 없음) | — |
| warmup failed (file missing) | error container 본문: `AI 모델 파일을 찾을 수 없어요.` + [설정으로 가기] | error container |
| warmup failed (other) | error container 본문: `AI 를 시작하지 못했어요.` + [다시 시도] | error container |
## 7. 함수 명세 (Function Specs)
| 함수 | 책임(1줄) | 시그니처(잠정) | 입력 | 출력 | 에러/실패 | 복잡? |
|------|-----------|----------------|------|------|-----------|-------|
| `ChatWarmupController.start` | 모델 ready 체크 → load 호출 → state 전이 | `Future<void> start()` | (deps via ctor) | `void` | failed → `ChatWarmupFailed(msg)` | **복잡** (fn-chat_warmup_controller.md) |
| `ChatWarmupController.retry` | failed/idle 에서 start 재호출 | `Future<void> retry()` | — | `void` | (start 동일) | 단순 |
| `ModelLifecycle.quickCheck` | SHA 해싱 없이 meta_kv + file existence 만으로 ready 추정 | `Future<ModelAvailability> quickCheck()` | (this.meta) | `ModelAvailability` | DB 예외 → `corrupt` (보수적) | 단순 |
| `GemmaLlmService.load` (수정) | concurrent 호출 시 같은 Future 반환 | `Future<void> load()` | — | `void` | (기존 동일) | **복잡** (fn-concurrent_load_guard.md) |
| `MockLlmService.load` (수정) | 동일한 concurrent 가드 적용 (테스트 일관성) | `Future<void> load()` | — | `void` | (기존 동일) | 단순 |
| `_ChatScreenState.initState` (수정) | mount 시 `chatWarmupProvider.notifier.start()` 호출 | `void initState()` | — | `void` | (controller 가 흡수) | 단순 |
| `_ChatScreenState._buildInputRow` (신규 추출) | warmup 상태 ↔ TextField/send 버튼 binding | `Widget _buildInputRow(ChatWarmupState, ChatSessionState)` | states | `Widget` | — | 단순 |
> 복잡 함수 2 개 → 개별 `fn-*.md`. 단순 함수는 본 표로 충분.
## 8. 흐름 / 알고리즘
### Happy path (사용자가 SettingsScreen 에서 옵트인 + 다운로드 완료한 상태)
1. 사용자가 `HabitListScreen` AppBar 의 🤖 탭 → ChatScreen push.
2. `initState``chatWarmupProvider.notifier.start()`.
3. `quickCheck()` 반환 `ready` → state = `ChatWarmupLoading`.
4. UI rebuild → 입력창 자리에 "AI 준비 중…" + spinner. send 버튼 영역에는 작은 spinner.
5. `llm.load()` 백그라운드 진행 (수 초). 그동안 사용자는 메시지 입력 불가능.
6. `load()` 성공 → state = `ChatWarmupReady` → UI rebuild → 정상 입력창.
7. 사용자 send → `ChatSessionController.userTurn` 내부 `llm.load()``isLoaded` 체크로 즉시 통과 → 곧바로 inference.
### quickCheck 가 ready 가 아닌 경우 (다운로드 미완 / opt-out / first-run)
1. `quickCheck()` 반환 `missing`/`downloading`/`corrupt` → state = `ChatWarmupUnavailable`.
2. UI 는 정상 입력창 (warmup 라벨 X). 사용자 send 시 기존 lazy `userTurn` 경로 → `llm.load()` 가 호출되면 어차피 `FileSystemException('model file missing')` 등으로 실패 → 기존 chat_screen error container 에 표시.
3. 즉, **warmup 은 "사용자가 이미 옵트인+다운로드 완료한 케이스" 만 최적화**. 다른 케이스는 기존 동작 유지 (변화 없음).
### Concurrent load
1. ChatScreen mount → warmup → `llm.load()` (Future A 진행 중).
2. (race) 사용자가 매우 빠르게 send → `userTurn` 내부 `llm.load()` 호출.
3. `GemmaLlmService.load()` 내부 `_loadingFuture != null` 이면 **그 future 를 반환**. native init 중복 X.
4. Future A 완료 시 두 caller 모두 정상 진행.
### Failure + retry
1. `load()` 가 throw (예: native init 실패, 파일 권한 변경, OOM) → catch.
2. state = `ChatWarmupFailed("AI 모델 준비에 실패했어요. 다시 시도해주세요.")` + 내부 error code 로깅 (사용자 노출 X).
3. UI: error container + `OutlinedButton('다시 시도')`. 탭 → `controller.retry()`.
4. retry = 단순히 state = `ChatWarmupIdle` 로 reset 후 `start()` 재호출.
### Unmount race
1. `start()` 진행 중 사용자가 back 버튼 → ChatScreen.dispose() → autoDispose → controller.dispose().
2. dispose() 에서 `_disposed = true` 플래그.
3. start() 의 `await llm.load()` 완료 후 `if (_disposed) return;` 가드 → state 변경 시도 skip.
## 9. 엣지케이스 & 에러 처리
| 케이스 | 처리 |
|---|---|
| `meta_kv` DB 가 lock / 손상 | `quickCheck` catch → `corrupt` 반환 → state = `ChatWarmupUnavailable` (warmup skip). 첫 send 시 정상 에러 경로. |
| `LlmService.load()` 가 throw (FileSystemException) | state = `ChatWarmupFailed`. 메시지: "AI 모델 파일을 찾을 수 없어요. 설정에서 다시 다운로드해주세요." |
| `load()` 가 throw (Native init 실패 — OOM / 런타임 호환성) | state = `ChatWarmupFailed`. 메시지: "AI 시작 중 오류가 발생했어요. 잠시 후 다시 시도해주세요." |
| concurrent load — 두 caller 동시 호출 | `_loadingFuture` 가드로 단일 future 공유. 두 caller 모두 완료 시점에 unblocked. |
| 사용자가 warmup 중 ChatScreen 떠남 | `_disposed` 가드 → state 변경 skip. 메모리는 native runtime 이 보유 (다음 진입 시 `isLoaded=true` → no-op). |
| AI opt-in 이 false 인 상태에서 ChatScreen 직접 진입 (불가능한 케이스 — 🤖 아이콘 자체가 hidden) | 안전 기본값으로 quickCheck=missing → unavailable. |
| ChatScreen 재진입 (앞서 load 됨) | `isLoaded=true``llm.load()` 즉시 return → state = ready 빠르게 전이 (사용자 인지 어려운 수 ms). 라벨 깜빡임 방지 위해 — **race 처리**: state 초기값을 `ChatWarmupIdle` 로 두고, `start()` 가 quickCheck 직후 isLoaded 체크해서 이미 loaded 면 곧바로 `ChatWarmupReady` (Loading 단계 skip). |
## 10. 테스트 계획
| 테스트 | 케이스 | AC mapping |
|---|---|---|
| `chat_warmup_test.dart``start() happy` | quickCheck=ready + load delay 100ms → state 시퀀스 [Idle → Loading → Ready] | AC1, AC3, AC4 |
| `chat_warmup_test.dart``start() skip when already loaded` | isLoaded=true → state 시퀀스 [Idle → Ready] (Loading 없음) | AC1 |
| `chat_warmup_test.dart``start() unavailable` | quickCheck=missing → state = Unavailable, load 호출 안 됨 | AC2 |
| `chat_warmup_test.dart``start() failure` | load throws → state = Failed(msg) | AC5 |
| `chat_warmup_test.dart``retry after failure` | Failed → retry() → Loading → Ready | AC5 |
| `chat_warmup_test.dart``unmount race` | start() 진행 중 dispose() → state 변경 시도 skip | AC6 |
| `chat_warmup_test.dart``concurrent load shares future` | start() + userTurn 시뮬 동시 → load 1회만 호출 | AC7 |
| `model_lifecycle_test.dart``quickCheck ready` (신규) | meta_kv 채워짐 + 파일 존재 → ready (SHA 안 함) | AC2 |
| `model_lifecycle_test.dart``quickCheck missing` (신규) | 파일 없음 → missing | AC2 |
| `chat_screen_test.dart``warmup loading label` (신규) | delay mock → "AI 준비 중…" 라벨 + spinner 노출 | AC3 |
| `chat_screen_test.dart``warmup ready hides label` (신규) | 완료 후 라벨 사라지고 send 활성 | AC4 |
| `chat_screen_test.dart``warmup failed shows retry` (신규) | error mock → error container + 재시도 버튼 | AC5 |
> 모킹 전략: `MockLlmService` 에 `loadDelay` / `loadThrows` 필드 추가 (테스트 helper). `ModelLifecycle` 은 in-memory `MetaDao` + `MemoryFileSystem` 패턴 (기존 `model_lifecycle_test.dart` 의 fake storage 재사용).
## 11. 리스크 & 대안 검토
| 리스크 | 대안 | 선택 | 근거 |
|---|---|---|---|
| **R1: concurrent load race** | (a) controller-level coordination (b) service-level `_loadingFuture` guard | **(b)** | frame suggestion 등 다른 caller 도 보호. service 가 진실의 원천. |
| **R3: load() 비용 정의** | (a) load = mmap only (b) load = mmap + dummy inference (KV-cache warm) | **(a)** | 코드 확인 결과 현재 `load()` = native init + mmap + getActiveModel. KV-cache warm 은 첫 inference 시 발생. (b) 는 별도 트랙 (#312 이슈와 묶일 수 있음). |
| **R4: SHA-256 재해싱 비용** | (a) quickCheck 메서드 신설 (file existence + meta_kv 만) (b) checkAvailability 결과를 Riverpod 캐시 | **(a)** | (b) 는 무효화 시점 (다운로드 완료/재시작) 관리 부담. (a) 는 명시적 의도 표현 + SHA 검증은 SettingsScreen 의 cold path 에 남김. |
| **R-extra: warmup 비용이 너무 커서 사용자가 chat 안 쓸 때도 GPU/RAM 점유** | (a) ChatScreen 진입 시 warmup (이 설계) (b) HabitListScreen 🤖 hover/long-press 시 (c) opt-in tier (사용자 선택) | **(a)** | (b) 모바일 hover 없음. (c) 옵션 폭증. ChatScreen 진입 = "사용자가 곧 쓸 의도 명시" 의 가장 강한 신호. |
> ADR 분리 안 함: 모든 결정이 backward-compatible 추가. `LlmService` 인터페이스 변경 없음, `ModelLifecycle.quickCheck` 도 추가 메서드. 되돌리기 어렵지 않음.
## 12. 미해결 질문 (Open Questions)
> UX-Reviewer 패스로 모두 해소. 본 섹션은 의도적으로 비어 있음.
- ~~OQ-1 microcopy 결정~~ → UX R3 채택, 마이크로카피 사전 §6 으로 이관.
- ~~OQ-2 재시도 버튼 위치~~ → UX R6 채택, error container 내부 우측 정렬.
- ~~OQ-3 재진입 깜빡임~~ → UX R4 endorse, fn-spec 의 빠른 경로로 Loading skip. min display time 같은 인위 지연은 금지 (안티패턴).
## 13. UX 리뷰 흡수 노트
- 본 설계서는 UX-REVIEW.md 의 Strong 4건 (R1, R2, R4, R5) 모두 채택, Suggest 2건 (R3, R6) 채택.
- 신규 AC4건 (AC9-AC12) 통합.
- 마이크로카피 사전 §6 으로 이관.
- 다음 페르소나 (03-Developer) 는 README 만 보면 충분. UX-REVIEW.md 는 결정 과정의 기록 으로 보존.
## 14. 참조
- Planner 산출물: Redmine #311 `## [AI] Planner` 섹션.
- 관련 follow-up: #219 (idle auto-unload), #220 (purge try/catch — 본 이슈의 concurrent load guard 와 동일 정신).
- 기존 설계: `docs/design/218-gemma-real-integration/`, `docs/design/260-gemma-tool-calling/`.

View File

@@ -0,0 +1,142 @@
# UX 리뷰: ChatScreen LLM warm-up (#311)
> **검토**: [AI] UX-Reviewer · **대상**: `./README.md` v1 + Planner AC 8개 · **날짜**: 2026-06-15
> **위치**: 02-Architect 단계 내 parallel review. Architect 가 흡수 후 03-Developer 인계.
## 요약
설계서가 백엔드 흐름 (state 머신, concurrent guard, lifecycle) 은 견고하다. 그러나 사용자가 실제로 보는 표면 — 라벨 톤, spinner 위치, 빠른 전이 시 깜빡임, 실패 시 다음 행동 — 에는 **결정 안 된 것이 너무 많고 (OQ 3건), 결정된 부분도 마찰을 만들 위험**이 있다. 6가지 권고를 아래에 정리.
---
## [Strong] R1 — "AI 준비 중…" 을 입력창 자리에 박으면 안 됨
**관점**: 마찰 / 흐름 / 정신 모델
**근거**:
- README §5 / §6 은 "입력창 자리에 라벨 + spinner" 를 기본안으로 둠.
- 그러면 **사용자가 메시지를 미리 타이핑해두는 행동 자체가 차단**된다. 사용자는 모델 로드를 기다리는 동안에도 "어떤 질문을 할지" 머릿속에서 정리하면서 손가락은 이미 키보드 위에 있다.
- 입력창이 사라지면 사용자는 "왜 안 보이지?" 하고 한 번 더 추론해야 한다 (마찰 +1).
- 더 큰 문제: ChatScreen 의 ListView 영역이 비어 있는 첫 진입 시점에 입력창까지 사라지면 **화면 전체가 spinner 하나뿐**이 된다 — "이 앱이 멈췄나?" 시그널.
**제안 (강력 권고)**:
- 입력창은 항상 보이게 유지. `enabled: false` 로만 잠그고 `hintText` 만 교체:
- 평상: `"습관 추가, 기록, 카탈로그 질문…"`
- warmup: `"AI 준비 중… 잠시만요"`
- send 버튼 자리에 `CircularProgressIndicator(strokeWidth: 2)` 표시 (현재 isStreaming 처리와 동일 패턴 — 일관성 ↑).
- 별도 상단 라벨/배지 추가 X. 사용자는 send 버튼이 spinner 인 것 + hint 한 줄로 충분히 추론 가능.
**README 영향**: §3 AC3, §5 다이어그램, §6 binding 절 모두 수정.
---
## [Strong] R2 — 사용자가 텍스트 입력하고 send 누르면 어떻게 되나? (현재 설계는 침묵)
**관점**: 정신 모델 / 마찰
**근거**:
- R1 권고를 받아들이면 입력창은 보이지만 `enabled: false`. 사용자가 키보드를 띄우고 타이핑하려 하면 → **반응 없음**. 또 다른 마찰.
- 만약 `enabled: true` 로 두고 send 만 disable 하면, 사용자가 메시지를 친 뒤 send 를 누르려는 순간 "왜 안 가지?" 로 또 다른 마찰.
- 어느 쪽이든 **사용자의 의도 (메시지를 보내고 싶음) 와 시스템의 상태 (아직 못 받음) 사이의 간극** 이 풀리지 않음.
**제안 (강력 권고)**:
- 입력창은 `enabled: true` 로 두어 **타이핑은 허용**한다. 사용자가 미리 메시지를 작성하도록.
- send 버튼은 disabled + spinner. 누를 수는 없음.
- **warmup 완료 시점**에 사용자가 이미 타이핑해둔 메시지가 있으면 → send 버튼 자동 활성화. (자동 send 까지는 X — 사용자 의도 확인 필요)
- AC4 에 한 줄 추가: "warmup ready 시점에 입력창의 텍스트가 비어있지 않으면 send 활성화."
**README 영향**: §3 AC3/AC4 보강.
---
## [Suggest] R3 — 첫 warmup 은 "예상 시간" 한 마디 더
**관점**: 정신 모델 / 인지된 지연
**근거**:
- 사용자에게 "AI 준비 중" 만 보여주면 — 0.5초 후에도, 5초 후에도, 10초 후에도 같은 라벨. 정신 모델은 점점 "이게 멈췄나?" 로 기운다.
- Gemma 4 E2B native init + mmap 은 디바이스에 따라 **2-8초** 범위로 추정 (cold launch). 첫 진입 시 한 번뿐이고 두 번째 진입부터는 거의 즉시 (`isLoaded=true`) — 즉 사용자가 이 라벨을 길게 보는 건 **첫 진입 단 한 번**.
- 그 한 번을 부드럽게 만들 가치가 있다.
**제안**:
- hint 를 `"AI 준비 중… 첫 시작은 몇 초 걸려요"` 로 한 번만 명시.
- 1회성 SnackBar 도 검토할 수 있으나 — 사용자가 곧바로 입력창 영역으로 시선이 가므로 hint 한 줄로 통합하는 게 단순.
**README 영향**: §3 AC3 의 라벨 문안, §12 OQ-1 해소.
---
## [Strong] R4 — 빠른 경로 (이미 loaded) 의 라벨 깜빡임을 명시적으로 차단
**관점**: 정신 모델
**근거**:
- README §9 의 "ChatScreen 재진입" 케이스 + fn-spec 의 "빠른 경로" 분기로 Loading state skip 처리가 들어가 있음 — 좋다.
- 하지만 §12 OQ-3 에 "라벨 깜빡임 가능 — 미해결" 이 남아있어 모순. fn-spec 의 빠른 경로가 Loading 을 스킵하므로 깜빡임은 일어나지 않음.
- 명확히 못 박을 것.
**제안**:
- OQ-3 를 OQ 에서 제거하고 §9 의 "빠른 경로" 분기 + fn-spec 의 step 2 를 명시적으로 인용한 **결정 노트**로 전환.
- min display time (300ms 등) 같은 인위 지연은 도입 **금지** — 사용자에게 거짓 작업을 보여주는 안티패턴.
**README 영향**: §9 endorse 표현, §12 OQ-3 삭제.
---
## [Strong] R5 — 실패 메시지의 다음 행동이 약함
**관점**: 에러 회복 / 마찰
**근거**:
- README §9 의 실패 메시지:
- "AI 모델 파일을 찾을 수 없어요. 설정에서 다시 다운로드해주세요." — 좋음 (다음 행동 명시).
- "AI 시작 중 오류가 발생했어요. 잠시 후 다시 시도해주세요." — 약함. "잠시 후" 가 얼마인지, "다시 시도" 가 어떻게 인지 불명.
- 사용자는 두 가지 의문: ① 이게 일시적 문제인가, 영구적 문제인가 ② 내가 뭘 해야 하나.
**제안**:
- "다시 시도" 버튼이 있으니, 메시지에서 "잠시 후 다시 시도해주세요" 는 빼고 **상태 + 행동 분리**:
- 상태: `"AI 를 시작하지 못했어요."`
- 행동: 별도 [다시 시도] 버튼 (이미 설계됨).
- AC5 에 "한국어 메시지는 상태만 기술, 행동은 버튼이 담당" 명시.
- 3회 연속 실패 시점에는 보조 안내 ("문제가 계속되면 앱을 재시작해보세요") — 후속 polish 로 deferrable.
**README 영향**: §9 메시지 사전 갱신, §3 AC5 보강.
---
## [Suggest] R6 — 재시도 버튼 위치는 error container 안
**관점**: 흐름 / 접근성
**근거**:
- README §12 OQ-2 가 "error container 내부 vs 입력창 옆 icon" 으로 열어둠.
- 입력창 옆 icon 은 평상시에는 없는 자리에 갑자기 나타나 사용자가 학습해야 함. 게다가 send 자리 근처에 또 다른 액션 = 오탭 위험.
- error container 는 이미 실패 메시지 영역이라 컨텍스트 일관 + 사용자가 "여기서 다음 행동" 학습.
**제안**:
- OQ-2 → 결정: **error container 내부 OutlinedButton('다시 시도')**.
- container 좌우 패딩, 메시지와 버튼은 column 으로 분리, 버튼은 우측 정렬.
**README 영향**: §12 OQ-2 해소.
---
## AC 보강 권고 (UX-Reviewer 가 작성한 추가 AC)
UX 관점에서 검증 가능한 새 AC 를 제안 (Architect 가 흡수 시 README §3 에 추가):
- [ ] **AC9 (신규)** Warmup 중 입력창은 `enabled: true` 로 타이핑 가능. send 만 disabled + spinner. → R1+R2.
- [ ] **AC10 (신규)** Warmup ready 시점에 입력창에 비어있지 않은 텍스트가 있으면 send 자동 활성화 (자동 send 는 X). → R2.
- [ ] **AC11 (신규)** `isLoaded=true` 인 재진입 시 Loading state 가 1 frame 이라도 노출되지 않는다 (위젯 테스트로 verify). → R4.
- [ ] **AC12 (신규)** 실패 메시지는 상태 기술만, 행동은 [다시 시도] 버튼이 담당. 메시지 본문에 "다시 시도해주세요" 같은 명령형 X. → R5.
## 마이크로카피 사전 (Architect 가 채택 시 README §6 또는 별도 부록)
| 상태 | 한국어 라벨 | 위치 |
|---|---|---|
| warmup loading | 입력창 `hintText`: `AI 준비 중… 첫 시작은 몇 초 걸려요` | 입력창 |
| warmup ready | `hintText`: `습관 추가, 기록, 카탈로그 질문…` | 입력창 (기존 유지) |
| warmup unavailable | (라벨 없음 — 평상시와 동일) | — |
| warmup failed (file missing) | error container: `AI 모델 파일을 찾을 수 없어요. 설정에서 다시 다운로드해주세요.` + [설정으로 가기] | error container |
| warmup failed (other) | error container: `AI 를 시작하지 못했어요.` + [다시 시도] | error container |
> [설정으로 가기] 는 R5 의 file-missing 케이스에서 "설정에서 다시 다운로드" 문구의 다음 행동을 한 탭으로 짧게 만드는 보조 권고. 채택은 Architect 재량.
## Architect 가 결정해야 할 것 (요약)
- Strong R1, R2, R4, R5 — 채택 또는 명시 거절 (OQ 로 남기지 말 것).
- Suggest R3, R6 + 마이크로카피 사전 + [설정으로 가기] — 재량.
- 새 AC 4건 — 채택 시 README §3 에 통합.

View File

@@ -0,0 +1,103 @@
# 함수 설계서: `ChatWarmupController.start` (#311)
> **부모 설계서**: ./README.md · **상태**: Approved (v0.4.1, 2026-06-15)
> **작성**: [AI] Architect · **구현**: `app/lib/state/chat_warmup_provider.dart:start` · **테스트**: `app/test/state/chat_warmup_test.dart`
## 1. 시그니처
```dart
class ChatWarmupController extends StateNotifier<ChatWarmupState> {
ChatWarmupController({
required this.llm,
required this.lifecycle,
}) : super(const ChatWarmupIdle());
final LlmService llm;
final ModelLifecycle lifecycle;
bool _disposed = false;
Future<void> start();
Future<void> retry();
@override
void dispose() { _disposed = true; super.dispose(); }
}
```
## 2. 책임 (단일 책임)
모델 ready 추정 → background `load()` → state 전이까지를 한 번의 트랜잭션으로 묶고, 모든 실패/취소 분기에서 안전하게 state 만 갱신한다.
## 3. 입력
| 파라미터 | 타입 | 제약/검증 | 설명 |
|----------|------|-----------|------|
| (ctor) `llm` | `LlmService` | non-null | `load`/`isLoaded` 만 사용. |
| (ctor) `lifecycle` | `ModelLifecycle` | non-null | `quickCheck` 만 사용. |
## 4. 출력
- **반환**: `Future<void>` — 완료 시점에 state 가 ready/failed/unavailable 중 하나로 확정.
- **부수효과**: `state =` 설정. 다른 I/O 없음.
## 5. 동작 / 알고리즘
```
1. 현재 state 가 Loading 이면 즉시 return (재진입 가드, retry 외에는 발생 X).
2. state = ChatWarmupLoading() 임시 설정 (단, 아래 빠른 경로 확인 전이라 안전).
→ ChatScreen 재진입 시 깜빡임 방지 위해 isLoaded 빠른 경로를 먼저 확인:
if (llm.isLoaded) {
_safeSet(const ChatWarmupReady());
return;
}
3. quickCheck = await lifecycle.quickCheck();
4. quickCheck != ready:
_safeSet(const ChatWarmupUnavailable());
return;
5. _safeSet(const ChatWarmupLoading()); // 본격 로드 시작
6. try { await llm.load(); }
catch (e) {
_safeSet(ChatWarmupFailed(_messageFor(e)));
return;
}
7. _safeSet(const ChatWarmupReady());
_safeSet(s) = if (_disposed) return; state = s;
```
`retry()` = `state = ChatWarmupIdle();``await start();`.
## 6. 에러 & 실패 모드
| 조건 | 처리 | 반환/예외 |
|------|------|-----------|
| `quickCheck` 가 DB lock 등으로 throw | `lifecycle.quickCheck` 내부 catch → `corrupt` 반환 | state = `Unavailable` (보수적) |
| `llm.load()``FileSystemException('model file missing')` | _messageFor 가 매핑 → "AI 모델 파일을 찾을 수 없어요. 설정에서 다시 다운로드해주세요." | state = `Failed` |
| `llm.load()` 가 기타 throw (native init 실패, OOM) | _messageFor → "AI 시작 중 오류가 발생했어요. 잠시 후 다시 시도해주세요." | state = `Failed` |
| start() 진행 중 dispose() | `_disposed = true``_safeSet` 가 no-op | state 변경 안 함 (마지막 set 유지) |
| concurrent start() 호출 | step 1 의 Loading 가드 — 외부에서는 retry() 만 사용하므로 정상 흐름에서 미발생 | early return |
## 7. 엣지케이스
- **ChatScreen 재진입 (이미 loaded)**: step 2 의 빠른 경로로 Loading 단계 skip → 라벨 깜빡임 없음.
- **start() 진행 중 ChatScreen pop → push (빠른 재진입)**: 첫 인스턴스 dispose, 두 번째 인스턴스의 start() 가 새로 호출. `_disposed` 가 인스턴스별이라 race 없음. `llm._loadingFuture` 가 native init 중복 차단.
- **opt-in 토글 race**: 사용자가 ChatScreen 진입과 동시에 SettingsScreen 에서 opt-out → ChatScreen 의 🤖 entry 가 hidden 되며 즉시 pop. dispose 가드로 안전.
## 8. 복잡도 / 성능
- 시간: O(1) + `lifecycle.quickCheck` O(1) (meta_kv 4 쿼리 + 1 stat) + `llm.load()` (수 초).
- 공간: state object 1개.
- 호출 빈도: ChatScreen mount 당 1회 (+retry 횟수).
## 9. 의존성
- `LlmService` (`load`, `isLoaded`) — 인터페이스 안정.
- `ModelLifecycle.quickCheck` (신규).
- `flutter_riverpod` `StateNotifier`.
## 10. 테스트 케이스
- [ ] 정상 happy: quickCheck=ready, load delay 100ms → 시퀀스 [Idle → Loading → Ready].
- [ ] 빠른 경로: isLoaded=true → 시퀀스 [Idle → Ready] (Loading 없음).
- [ ] unavailable: quickCheck=missing → 시퀀스 [Idle → Unavailable], load 호출 안 됨.
- [ ] failure: load throws FileSystemException → state = Failed + 매핑된 한국어 메시지.
- [ ] failure: load throws StateError → state = Failed + generic 메시지.
- [ ] retry: Failed → retry() → Loading → Ready.
- [ ] unmount race: start() 진행 중 dispose() → state 변경 시도 무시 (마지막 state = Loading 유지).
- [ ] DB 예외: quickCheck 가 throw → Unavailable.
## 11. 추적성
- 인수조건: AC1, AC2, AC3, AC4, AC5, AC6.
- 관련 ADR: 없음.

View File

@@ -0,0 +1,85 @@
# 함수 설계서: `GemmaLlmService.load` concurrent guard (#311)
> **부모 설계서**: ./README.md · **상태**: Approved (v0.4.1, 2026-06-15)
> **작성**: [AI] Architect · **구현**: `app/lib/data/ai/gemma_llm_service.dart:load` (수정) · **테스트**: `app/test/data/ai/gemma_llm_service_test.dart` (concurrent 케이스 추가) / `chat_warmup_test.dart` (시뮬)
## 1. 시그니처
```dart
class GemmaLlmService implements LlmService {
Future<void>? _loadingFuture; // 신규 필드
@override
Future<void> load() {
if (_loaded) return Future.value();
final existing = _loadingFuture;
if (existing != null) return existing;
final future = _doLoad();
_loadingFuture = future;
return future.whenComplete(() {
_loadingFuture = null;
});
}
Future<void> _doLoad() async {
// 기존 load() 본문 (initialize → installModel → getActiveModel).
}
}
```
> `MockLlmService.load()` 도 같은 패턴 적용 (`_loadingFuture` 필드 추가). 테스트의 동시성 검증 일관성.
## 2. 책임 (단일 책임)
`load()` 가 진행 중일 때 다른 caller 가 호출하면 새 작업을 시작하지 않고 같은 Future 를 반환한다. native runtime 의 `FlutterGemma.installModel` + `getActiveModel` 가 두 번 불리지 않도록 보호.
## 3. 입력
- 없음 (메서드).
## 4. 출력
- **반환**: `Future<void>` — 단일 native init 작업의 완료 future. 모든 caller 가 같은 인스턴스 공유.
- **부수효과**: `_loadingFuture`, `_loaded`, `_model` 필드 변경.
## 5. 동작 / 알고리즘
```
1. _loaded == true → 즉시 완료 Future 반환.
2. _loadingFuture != null → 그 future 그대로 반환. (새 작업 시작 X)
3. 그 외:
a. future = _doLoad();
b. _loadingFuture = future;
c. future.whenComplete(() => _loadingFuture = null);
d. return future;
```
`_doLoad()` 내부 = 기존 `load()` 본문 그대로 (initialize → installModel → getActiveModel → _loaded=true).
## 6. 에러 & 실패 모드
| 조건 | 처리 | 반환/예외 |
|------|------|-----------|
| `_doLoad()` 가 throw | `whenComplete``_loadingFuture = null` 처리 후 throw 전파 | 모든 caller 가 같은 exception 받음 |
| caller A 가 await 중에 caller B 도 호출 | 같은 future 반환 (step 2) | 둘 다 동일하게 완료 또는 fail |
| 첫 호출 실패 후 재시도 | `_loadingFuture=null` 로 cleared → 다음 호출 시 새 `_doLoad()` 시작 | 정상 재시도 가능 |
## 7. 엣지케이스
- **load() 와 unload() race**: caller A 가 load → 진행 중 caller B 가 unload() 호출. `_doLoad()` 가 _model 설정 직후 unload 가 _model.close() 호출. 본 이슈 범위 외 — 현재 시점에 unload() 호출 경로 없음 (#219 가 다룰 영역). 본 설계는 load 의 concurrent 만 다룬다.
- **whenComplete 실행 시점**: future 가 동기 완료 (이미 _loaded=true 인 첫 분기) 시에도 `_loadingFuture=null` 보장. 단, step 1 에서 early return 이라 _loadingFuture 는 손대지 않음.
## 8. 복잡도 / 성능
- 시간: 첫 호출 = 기존 _doLoad 비용. 후속 caller = O(1) future 공유.
- 공간: future 1개 + null 가능 필드.
- 호출 빈도: ChatScreen mount + userTurn 첫 호출 + frame suggestion (#215) — 모두 일생에 몇 회.
## 9. 의존성
- `flutter_gemma` `FlutterGemma.initialize` / `installModel` / `getActiveModel` (기존).
- `_loaded` / `_model` 필드 (기존).
## 10. 테스트 케이스
- [ ] 정상: load() 1회 호출 → _doLoad() 1회 실행.
- [ ] concurrent: load() 두 번 await 동시 호출 → _doLoad() 1회만 실행, 두 future 같은 Future 인스턴스.
- [ ] 실패 후 재시도: 첫 _doLoad throws → caller A 에게 propagate → _loadingFuture cleared → 두 번째 load() 새 _doLoad 시작.
- [ ] isLoaded 이미 true: load() → 즉시 완료, _doLoad 미실행.
> Gemma native 는 통합 테스트에서만 검증 가능. 단위 테스트는 MockLlmService 의 동일 가드로 시뮬.
## 11. 추적성
- 인수조건: AC7.
- 관련 follow-up: #220 (purge try/catch — 동일 정신).
- 관련 ADR: 없음.

View File

@@ -0,0 +1,207 @@
# 설계서: Tool call 직전 prefix 토큰 corpus & 조건부 push (#312)
> **상태**: Draft
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
> **추적성** — Redmine: #312 · 관련 ADR: ADR-0006 (조건부, Developer 단계에서 corpus 결과 확정 후 작성)
> · 구현 파일: `app/lib/state/chat_providers.dart:144-153` (수정 후보), `app/lib/ai/diagnostics/corpus_logger.dart` (신규) · 테스트: `app/test/state/chat_session_prefix_test.dart` (신규)
## 1. 목적 (Why)
> Planner 인용: tool call 직전 Gemma 4 E2B 가 뱉는 prefix 자연어를 실측 corpus 로 측정하고, 30% 임계에 따라 partial push 구현 또는 의도적 폐기 결정 기록을 남긴다.
`chat_providers.dart:144-153``for await` 루프는 `LlmFunctionCall` 도착 시 `accumulated` 텍스트를 버리고 `break` 한다. Gemma 4 가 tool call 전에 "수면 카탈로그를 보여드릴게요" 같은 의미있는 한국어 prefix 를 자주 뱉는다면, 그 정보가 사용자 화면에서 사라지는 UX 손실이 발생한다. 본 이슈는 손실량을 실측한 뒤 push 구현 또는 의도적 폐기 둘 중 하나로 확정한다.
## 2. 범위 (Scope)
- **포함**:
- 디버그 빌드 전용 `CorpusLogger` 인터페이스 + `ChatSessionController` 에 optional inject.
- corpus 수집 절차 문서 (`corpus-procedure.md`) 와 결과 표 (`docs/research/312-tool-prefix-corpus.md`).
- 임계 (5건 이상 / 15) 충족 시 `userTurn` 의 break 직전 `accumulated.trim().isNotEmpty``ModelChatMessage` push.
- 임계 미달 시 폐기 주석 + ADR 0006 결정 기록.
- 어느 경로든 `ChatSessionController` 단위 테스트 1+ 건.
- **제외 (out of scope)**:
- `ParallelFunctionCallResponse` first-only 한계 (AC4 의 follow-up 이슈로 발행만).
- Gemma 4 thinking/reasoning tag 처리 (`isThinking:false` 비활성 중).
- 일반 streaming UX 폴리시 (cursor, 토큰 속도, scroll).
- 프로덕션 빌드의 로깅 — `CorpusLogger``kDebugMode` 가드 + null default.
## 3. 인수조건 (Acceptance Criteria)
- [ ] **AC1**: `docs/research/312-tool-prefix-corpus.md` 에 15 케이스 표 (사용자 입력 / tool name / `accumulated` raw / 의미있는 prefix 여부 (Y/N) / 사유). Planner 의 운영 정의를 본 설계서가 §6 에서 확정 (R2 해소).
- [ ] **AC2 (조건부 구현)**: corpus 결과가 ≥5/15 이면 `userTurn` 의 break 직전 push (fn-userTurn_partial_push §5 경로 A). ≤4/15 이면 폐기 주석 + ADR 0006 + 경로 B (no-op 회귀 가드).
- [ ] **AC3 (단위 테스트)**: `ChatSessionController` 단위 테스트 — fake `LlmService``text → text → function_call` 순으로 emit 했을 때 결과 `state.messages` 의 길이와 순서를 검증. 경로 A 면 [User, Model(prefix), ToolCall] 3 개. 경로 B 면 [User, ToolCall] 2 개 + prefix 누락이 의도적임을 주석으로 명시.
- [ ] **AC4**: Parallel call 한계를 `userTurn` 코드 인근 주석 + 본 설계서 §11 에 명시 + Redmine 신규 이슈 발행 (예: "#312-followup ParallelFunctionCallResponse 다중 호출 처리").
## 4. 컨텍스트 & 제약
- **의존성**:
- `app/lib/data/ai/llm_service.dart``LlmChatEvent` sealed class (`LlmTextChunk` / `LlmFunctionCall` / `LlmDone`).
- `app/lib/state/chat_providers.dart``ChatSessionController.userTurn` 의 multi-turn 루프.
- 실 단말 — Gemma 4 E2B `.litertlm` 모델 (#218). corpus 는 실제 inference 결과여야 함 (mock 무효).
- **제약**:
- 사용자가 수동으로 APK 를 실행해 corpus 를 수집 — reproducibility 낮음. 본 설계는 logger 인터페이스로 수집 부담을 최소화하는 데 집중.
- `kDebugMode` 가드로 production 영향 0. 빌드 사이즈 +수 KB 이내.
- `LlmService` 인터페이스 변경 금지 — logger 는 `ChatSessionController` 의 ctor 파라미터로만 주입.
- **가정**:
- Gemma 4 E2B 의 함수 호출 메커니즘은 SDK 가 prompt 를 자동 렌더 (cf. `feedback_flutter_gemma_api_quirks`). 따라서 prefix 텍스트는 SDK 가 자체 emit 하는 자연어이지 사용자가 prompt 로 유도한 것이 아니다.
- 동일 프롬프트라도 sampling 노이즈로 다른 결과가 나올 수 있음. 15 케이스 1 회 측정이 절대 진리는 아니지만 의사 결정에는 충분.
## 5. 아키텍처 개요
- **모듈 / 파일**:
- 신규: `app/lib/ai/diagnostics/corpus_logger.dart``abstract class CorpusLogger` + `DebugCorpusLogger` 구현 + factory.
- 수정: `app/lib/state/chat_providers.dart``ChatSessionController``final CorpusLogger? logger` 필드 추가, ctor 에 optional 인자. `userTurn` 의 event 루프에서 hook 호출. corpus 결과 확정 후 §5 의 break 직전에 push 분기 (경로 A) 또는 폐기 주석 (경로 B).
- 신규: `docs/research/312-tool-prefix-corpus.md` — corpus 표 (Developer 가 수집 후 채움).
- 신규: `docs/design/312-tool-prefix-corpus/corpus-procedure.md` — 절차 매뉴얼.
- **데이터 흐름**:
```
[User input] → ChatSessionController.userTurn
LlmService.startChat → _session.sendUser(text)
↓ (Stream<LlmChatEvent>)
for await event:
LlmTextChunk → accumulated += text
→ logger?.onTextChunk(turn, text) ← 신규 hook
→ state.streamingText = accumulated
LlmFunctionCall → toolCall = event
→ logger?.onFunctionCall(turn, ← 신규 hook
accumulated, event.name, event.args)
→ [경로 A] if accumulated.trim().isNotEmpty:
state.messages.add(ModelChatMessage(accumulated))
→ break
state.messages.add(ToolCallChatMessage(...))
```
- **I/O ↔ 순수 경계**: `CorpusLogger` 의 구현체가 I/O (file or stdout). `userTurn` 의 push 분기 자체는 순수 (state mutation 뿐) — 테스트 용이.
```
ChatSessionController ────── (optional) ──── CorpusLogger
│ │
│ userTurn () │ onTextChunk()
│ │ onFunctionCall()
│ ↓
│ file / stdout
state.messages
ChatScreen (ListView)
```
## 6. 데이터 모델
### 6.1 "의미있는 prefix" 운영 정의 (R2 확정)
- **포함 (의미있음, Y)**:
- 공백 제외 한국어 자연어 ≥10 자.
- 정보 전달 의도 있음 (예: "수면 카탈로그에서 추천 항목을 보여드릴게요").
- **제외 (의미없음, N)**:
- 빈 문자열 또는 공백/줄바꿈만.
- boilerplate: "search_catalog 를 호출합니다", "잠시만요", "조회 중...", "...", 영어 함수명 문구.
- 단순 응대: "네", "알겠습니다", "확인했어요" 단독.
- 사용자 입력 그대로 echo.
### 6.2 corpus 표 schema (`docs/research/312-tool-prefix-corpus.md`)
| 컬럼 | 타입 | 설명 |
|------|------|------|
| `#` | int | 1-15 |
| `category` | enum | catalog / add_habit / log_tracker_entry / streak |
| `user_input` | str | 그대로 |
| `tool_name` | str | Gemma 가 호출한 도구 |
| `accumulated_raw` | str (multiline) | tool call 도착 시점의 누적 텍스트 (no trim) |
| `meaningful` | Y/N | §6.1 기준 |
| `note` | str | Y/N 사유 1줄 |
### 6.3 임계 (R4 확정)
- **5+ / 15 (≥33%) → 경로 A (push 구현)**.
- **4 또는 그 이하 → 경로 B (폐기 + ADR 0006)**.
- borderline (정확히 5) 도 경로 A 채택 (UX 손실 보수적 보호). 정확히 4 면 +5 케이스 추가 수집 후 재판정 (총 20 케이스, 임계 7).
## 7. 함수 명세 (Function Specs)
| 함수 | 책임 (1줄) | 시그니처 (잠정) | 입력 | 출력 | 에러 / 실패 | 복잡? |
|------|-----------|----------------|------|------|-------------|-------|
| `CorpusLogger.onTextChunk` | 텍스트 청크 도착 시점 기록 | `void onTextChunk(int turn, String text)` | turn idx, chunk | void | 구현체 I/O 실패는 swallow (debug only) | **복잡** ([fn](./fn-corpus_logger.md)) |
| `CorpusLogger.onFunctionCall` | tool call 도착 시점의 누적 prefix + tool name 기록 | `void onFunctionCall(int turn, String accumulated, String toolName, Map<String,dynamic> args)` | turn idx, prefix, name, args | void | I/O swallow | **복잡** ([fn](./fn-corpus_logger.md)) |
| `DebugCorpusLogger.maybeCreate` | factory — `kDebugMode` + dart-define 가드 | `static CorpusLogger? maybeCreate()` | none | nullable logger | exception swallow → null | 단순 (factory) |
| `ChatSessionController.userTurn` (수정) | event 루프 + 조건부 push | (기존 시그니처) | (기존) | (기존) | (기존) | **복잡** ([fn](./fn-userTurn_partial_push.md)) |
> 복잡 기준: state mutation 분기 / 외부 I/O (logger) / corpus 결과에 따라 코드 경로 갈라짐.
## 8. 흐름 / 알고리즘
### Phase A — corpus 수집 (Developer 수동 작업)
1. `flutter run --debug --dart-define=ENABLE_CORPUS_LOG=1` 으로 APK 빌드 & 단말 설치.
2. `corpus-procedure.md` 의 15 프롬프트를 차례로 ChatScreen 에 입력.
3. `flutter logs` 또는 logcat `--tag CorpusLogger` 로 raw event dump 수집.
4. dump 를 `docs/research/312-tool-prefix-corpus.md` 표에 정리.
5. §6.3 임계로 경로 A / B 결정.
### Phase B — 조건부 구현
- 경로 A (push):
```
} else if (event is LlmFunctionCall) {
toolCall = event;
// #312 — corpus 측정 결과 X/15 가 의미있는 prefix → push 채택.
if (accumulated.trim().isNotEmpty) {
_appendPrefixMessage(accumulated);
}
break;
}
```
- 경로 B (폐기 명시):
```
} else if (event is LlmFunctionCall) {
toolCall = event;
// #312 — corpus 측정 결과 X/15 만 의미있는 prefix → 의도적 폐기.
// ADR-0006 참조. accumulated 는 버린다.
break;
}
```
### Phase C — 테스트
- fake `LlmService` 가 `[Text("수면 카탈로그를 보여드릴게요 "), FunctionCall(search_catalog, {...})]` 순으로 emit.
- 경로 A: `state.messages == [User, Model("수면 카탈로그를 보여드릴게요"), ToolCall(...)]` (trim 적용).
- 경로 B: `state.messages == [User, ToolCall(...)]` (prefix 누락 명시적 검증).
- 보너스: 빈 prefix 케이스 — `[FunctionCall(...)]` 직접 emit → 경로 A 도 ModelChatMessage 추가 안 함 (trim guard).
## 9. 엣지케이스 & 에러 처리
- **빈 prefix**: `accumulated.trim().isEmpty` → push 안 함 (경로 A 의 가드).
- **whitespace only prefix** (Gemma 가 `"\n\n"` 같은 토큰 뱉음): trim 가드로 push 안 함.
- **prefix 가 사용자 입력 echo**: §6.1 의 운영 정의로 corpus 수집 시 N 판정. 구현 단계에선 trim/length 가드만 — echo 감지는 false positive 위험 (정상 paraphrase 까지 잡힐 수 있음). corpus 결과로 임계 산정에 영향만.
- **logger I/O 실패**: `DebugCorpusLogger` 내부 try/catch swallow. 절대 `userTurn` 흐름을 깨면 안 됨.
- **production 빌드**: `DebugCorpusLogger.maybeCreate()` → null 반환. `logger?.onTextChunk` 의 null-aware 가 0 비용.
- **dart-define 미설정 + debug**: factory 가 null 반환 (opt-in). 평소 debug run 도 영향 없음.
## 10. 테스트 계획
### 단위 테스트 (AC3)
- [ ] `chat_session_prefix_test.dart` — 경로 A
- Given: fake LlmService 가 `[Text("수면 카탈로그를 보여드릴게요 "), FunctionCall("search_catalog", {})]` emit.
- When: `userTurn("수면 습관 추천")`.
- Then: state.messages 의 마지막 3 개 = [User, Model("수면 카탈로그를 보여드릴게요"), ToolCall("search_catalog", {}, _)].
- [ ] `chat_session_prefix_test.dart` — 경로 A trim guard
- Given: fake 가 `[Text("\n\n"), FunctionCall(...)]` emit.
- Then: state.messages 에 ModelChatMessage 추가 안 됨.
- [ ] (경로 B 채택 시) `chat_session_prefix_test.dart` — 폐기 회귀 가드
- Given: fake 가 `[Text("의미있는 prefix"), FunctionCall(...)]` emit.
- Then: state.messages 에 ModelChatMessage("의미있는 prefix") 없음 — corpus 결과로 폐기가 정당화됨을 명시적으로 assert.
### logger 단위 테스트
- [ ] `CorpusLogger.maybeCreate` — `kDebugMode=true && ENABLE_CORPUS_LOG=1` → non-null.
- [ ] `maybeCreate` — release → null.
- [ ] `DebugCorpusLogger.onFunctionCall` — 호출 시 stdout 에 `[CorpusLogger]` 라벨 + JSON 한 줄 emit.
### 통합 — 수동 corpus (AC1)
- 절차서 `corpus-procedure.md` 따라 수행 + 결과 표.
## 11. 리스크 & 대안 검토
- **선택**: optional logger inject + `kDebugMode` 가드. 프로덕션 0 영향, corpus 수집은 dart-define on/off.
- **대안 1 (기각)**: ChatSessionController 에 직접 logging 코드 박기 — 프로덕션 영향, 테스트 mock 어려움.
- **대안 2 (기각)**: Riverpod provider 로 logger 주입 — 단일 진실 (controller ctor) 보다 모호. 본 이슈는 수명 짧음 (corpus 끝나면 logger 제거 검토).
- **트레이드오프**:
- logger 가 ChatSessionController API 표면을 늘림 → 본 이슈 후 제거 가능 (코드 적음).
- dart-define 가드는 IDE 자동완성에서 안 보임 → corpus-procedure.md 에 명시.
- **ADR 0006**: 경로 B (폐기) 채택 시에만 작성. push 채택 시 본 설계서 자체가 결정 기록 — ADR 별도 발행 안 함.
- **ParallelFunctionCallResponse (AC4)**: 본 이슈 OOS. follow-up 이슈 발행 권고 — "#312-followup ParallelFunctionCallResponse 다중 호출 처리: 현재 first call only yield 후 return. 다중 tool 시나리오가 Gemma 4 E2B 에서 발생하는지 corpus 결과로 함께 측정 가능 (보너스 컬럼)."
## 12. 미해결 질문 (Open Questions)
없음. R1-R5 해소 완료:
- R1 → 15 케이스 1 회 측정 (§4 가정).
- R2 → §6.1 운영 정의 확정.
- R3 → optional CorpusLogger (§5, §11).
- R4 → 임계 5/15 확정 (§6.3).
- R5 → state.messages 순서 보존 + trim guard (§9).

View File

@@ -0,0 +1,89 @@
# Corpus 수집 절차 (#312)
> **부모 설계서**: ./README.md · **목적**: Developer 가 corpus 를 재현 가능하게 수집할 수 있도록 절차 명문화.
## 1. 빌드
```bash
cd app
flutter build apk --debug --dart-define=ENABLE_CORPUS_LOG=true
# 또는 단말 연결 후
flutter run --debug --dart-define=ENABLE_CORPUS_LOG=true
```
`ENABLE_CORPUS_LOG=true` 가 빠지면 `DebugCorpusLogger.maybeCreate()` 가 null 반환 → logging 없음.
## 2. 로그 캡처
```bash
# adb 연결된 단말
adb logcat | grep CorpusLogger > /tmp/corpus-raw.log
# 또는 flutter run 의 stdout
flutter run --debug --dart-define=ENABLE_CORPUS_LOG=true 2>&1 \
| grep CorpusLogger > /tmp/corpus-raw.log
```
각 줄은 `[CorpusLogger] {"kind":"text_chunk"|"function_call",...}` 형태의 JSON.
## 3. 프롬프트 시퀀스 (15 케이스)
ChatScreen 진입 후 아래를 순서대로 입력. 각 프롬프트 사이에 ↻ 로 세션 초기화 (turn 격리).
### catalog 카테고리 (5)
1. 수면 관련 습관 추천해줘
2. 아침에 할 수 있는 습관 뭐 있어?
3. 스트레스 관리 프로토콜 알려줘
4. 운동 관련 카탈로그 보여줘
5. 명상 어떤 게 있어?
### add_habit 카테고리 (5)
6. 아침 햇빛 보기 습관 추가해줘
7. 매일 물 2L 마시기 추가해줘
8. 잠들기 전 스트레칭 등록할래
9. 출근 전 명상 5분 추가해줘
10. 점심 후 산책 습관 만들어줘
### log_tracker_entry 카테고리 (3)
11. 오늘 햇빛 봤어 체크해줘
12. 어제 운동한 거 기록해줘
13. 오늘 명상 완료
### streak 카테고리 (2)
14. 내 연속 기록 어때?
15. 스트릭 보여줘
## 4. 결과 표 작성
`/tmp/corpus-raw.log` 의 각 `function_call` 이벤트에서 `accumulated_prefix` 를 추출해 `docs/research/312-tool-prefix-corpus.md` 표에 채운다.
표 schema (README §6.2 참조):
```markdown
| # | category | user_input | tool_name | accumulated_raw | meaningful | note |
|---|----------|-----------|-----------|-----------------|------------|------|
| 1 | catalog | 수면 관련 습관 추천해줘 | search_catalog | "수면 카탈로그를 보여드릴게요" | Y | 정보 전달 의도 + 14자 |
| 2 | catalog | 아침에 할 수 있는 습관 뭐 있어? | search_catalog | "" | N | 빈 prefix |
| ... |
```
판정 기준은 README §6.1 의 운영 정의:
- **Y**: 공백 제외 한국어 자연어 ≥10 자 + 정보 전달 의도.
- **N**: 빈/공백/boilerplate/단순 응대/echo.
## 5. 임계 판정
- Y 카운트 ≥5 → 경로 A (push 구현).
- Y 카운트 =4 → +5 케이스 추가 수집 (총 20, 임계 7).
- Y 카운트 ≤3 → 경로 B (폐기 + ADR-0006).
## 6. 후처리
- corpus 결과를 Redmine #312`## [AI] Developer` 섹션 (또는 별도 댓글) 에 요약: Y/N count + 채택 경로.
- 채택 경로에 따라 `fn-userTurn_partial_push.md` 의 경로 A 또는 B 를 구현.
- 경로 B 채택 시 ADR-0006 작성 (`docs/adr/0006-tool-call-prefix-discard.md` 또는 적합한 제목).
- corpus 수집 종료 후 `--dart-define=ENABLE_CORPUS_LOG=true` 사용 빈도 0 → 향후 CorpusLogger 제거 follow-up 이슈 발행 검토.
## 7. 보너스 — ParallelFunctionCallResponse 측정
같은 raw log 에서 한 turn 안에 `function_call` 이 2 회 이상 emit 되는지 확인. 발생 시 AC4 의 follow-up 이슈에 빈도 데이터 포함.

View File

@@ -0,0 +1,134 @@
# 함수 설계서: `CorpusLogger` (#312)
> **부모 설계서**: ./README.md · **상태**: Draft
> **작성**: [AI] Architect · **구현**: `app/lib/ai/diagnostics/corpus_logger.dart` (신규) · **테스트**: `app/test/ai/diagnostics/corpus_logger_test.dart` (신규)
## 1. 시그니처
```dart
abstract class CorpusLogger {
void onTextChunk(int turn, String text);
void onFunctionCall(
int turn,
String accumulatedPrefix,
String toolName,
Map<String, dynamic> args,
);
}
class DebugCorpusLogger implements CorpusLogger {
/// kDebugMode + --dart-define=ENABLE_CORPUS_LOG=1 일 때만 non-null.
/// production 빌드에서는 항상 null.
static CorpusLogger? maybeCreate();
@override
void onTextChunk(int turn, String text);
@override
void onFunctionCall(...);
}
```
## 2. 책임 (단일 책임, 1줄)
ChatSessionController 의 event 루프에서 발생한 텍스트 청크와 function call 의 raw payload 를 디버그 빌드에서 stdout 으로 dump 한다 — corpus 수집 부담을 줄이기 위한 한시적 진단 도구.
## 3. 입력
### `onTextChunk`
| 파라미터 | 타입 | 제약/검증 | 설명 |
|----------|------|-----------|------|
| `turn` | int | ≥0 | userTurn 내 multi-turn 루프의 turn index (0=첫 LLM 응답). |
| `text` | String | non-null | 도착한 텍스트 청크 (raw, 누적 X). |
### `onFunctionCall`
| 파라미터 | 타입 | 제약/검증 | 설명 |
|----------|------|-----------|------|
| `turn` | int | ≥0 | 동일. |
| `accumulatedPrefix` | String | non-null | tool call 도착 시점까지의 누적 텍스트 (chunks 의 concat). |
| `toolName` | String | non-null, non-empty | Gemma 가 호출한 도구 이름. |
| `args` | `Map<String, dynamic>` | non-null | tool 인자. JSON serializable 가정. |
### `maybeCreate`
- 입력 없음.
## 4. 출력
- `onTextChunk` / `onFunctionCall`: **반환 없음**. 부수효과 = stdout 한 줄 emit (디버그). I/O 실패 시 swallow.
- `maybeCreate`: **반환** `CorpusLogger?``kDebugMode` 가 true 이고 `const bool.fromEnvironment('ENABLE_CORPUS_LOG')` 가 true 일 때 `DebugCorpusLogger()` 인스턴스, 그 외 null.
## 5. 동작 / 알고리즘
### `DebugCorpusLogger.onTextChunk`
```
1. _emit({
'kind': 'text_chunk',
'turn': turn,
'text': text,
});
```
### `DebugCorpusLogger.onFunctionCall`
```
1. _emit({
'kind': 'function_call',
'turn': turn,
'accumulated_prefix': accumulatedPrefix,
'tool_name': toolName,
'args': args,
});
```
### `_emit(Map<String, dynamic> payload)`
```
1. try:
2. final line = '[CorpusLogger] ' + jsonEncode(payload);
3. developer.log(line, name: 'CorpusLogger');
4. catch (_):
5. // swallow — diagnostic 이 user flow 를 깨지 않게.
```
### `DebugCorpusLogger.maybeCreate`
```
1. if (!kDebugMode) return null;
2. const enabled = bool.fromEnvironment('ENABLE_CORPUS_LOG', defaultValue: false);
3. if (!enabled) return null;
4. return DebugCorpusLogger._();
```
## 6. 에러 & 실패 모드
| 조건 | 처리 | 반환/예외 |
|------|------|-----------|
| `jsonEncode` 가 args 의 non-serializable 키로 throw | `_emit` 의 try/catch swallow | void (silent) |
| `developer.log` I/O 실패 | swallow | void |
| `maybeCreate` 가 production 호출 | `kDebugMode=false` 분기에서 null | null (정상) |
| ctor 직접 호출 시도 | private ctor `_()` 로 차단 | 컴파일 에러 |
## 7. 엣지케이스
- **매우 빈번한 호출**: 토큰 단위 stream 이라 `onTextChunk` 가 초당 수십 회. `developer.log` 가 stdout flush 부담 — 단, debug only + 한시적이라 수용.
- **args 에 BigInt / DateTime**: `jsonEncode` 가 throw → swallow. corpus 결과 누락 시 코드 보강 (toString fallback) 가능하지만 본 설계는 swallow 만.
- **multi-turn 루프**: 같은 userTurn 내에서 turn 0, 1, 2 ... 각각의 prefix 가 모두 캡처되어야 비교 가능 — caller (ChatSessionController) 가 정확한 turn idx 를 넘긴다.
- **logger null 이지만 inject 됨**: callsite 가 `logger?.onTextChunk(...)` 패턴이므로 null-safe.
## 8. 복잡도 / 성능
- 시간: 각 호출 O(payload 크기). `jsonEncode` 가 prefix 길이에 선형.
- 공간: emit 마다 임시 string. 영구 보관 없음 (stdout sink).
- 호출 빈도: 토큰당 1회 (text_chunk), tool call 당 1회 (function_call). 한 userTurn 에 수십-수백 호출 가능 — debug only 라 수용.
## 9. 의존성
- `dart:convert``jsonEncode`.
- `dart:developer``log`.
- `flutter/foundation.dart``kDebugMode`.
- 환경 변수: `ENABLE_CORPUS_LOG` (dart-define).
## 10. 테스트 케이스
- [ ] **maybeCreate**: production 시뮬 (kDebugMode false fake) → null 반환.
- [ ] **maybeCreate**: debug + ENABLE_CORPUS_LOG=false → null.
- [ ] **maybeCreate**: debug + ENABLE_CORPUS_LOG=true → non-null DebugCorpusLogger.
- [ ] **onFunctionCall happy**: 인자 정상 → stdout 에 `[CorpusLogger]` 라벨 + JSON 한 줄 emit (capture for verification).
- [ ] **onFunctionCall non-serializable args**: `{'date': DateTime.now()}` → throw 안 함 (swallow), test 가 timeout 없이 종료.
- [ ] **onTextChunk** 빈 텍스트 → swallow 없이 정상 emit (filter 안 함, 무엇이 들어왔는지 그대로 기록하는 게 corpus 의 정직성).
> ENABLE_CORPUS_LOG 의 dart-define 기반 테스트는 `--dart-define=ENABLE_CORPUS_LOG=true` 로 별도 `flutter test` invocation 또는 mockable wrapper 로 분리. Architect 권고 = wrapper (`bool _readEnableFlag()` 를 visibleForTesting 으로 expose) 로 테스트 간소화.
## 11. 추적성
- 인수조건: AC1 (corpus 수집 인프라).
- 관련 ADR: 없음 (한시적 진단 도구).
- 본 이슈 종료 후 제거 여부 검토 — follow-up 이슈로 발행 권장 ("CorpusLogger 정리 — corpus 결과 반영 후 logger 제거 또는 영구화 결정").

View File

@@ -0,0 +1,116 @@
# 함수 설계서: `ChatSessionController.userTurn` partial push 분기 (#312)
> **부모 설계서**: ./README.md · **상태**: Draft
> **작성**: [AI] Architect · **구현**: `app/lib/state/chat_providers.dart:144-153` 수정 · **테스트**: `app/test/state/chat_session_prefix_test.dart` (신규)
## 1. 시그니처
변경 없음 (메서드 시그니처 유지):
```dart
Future<void> userTurn(String text, BuildContext context) async;
```
본 설계서는 메서드 내부 event 루프의 `LlmFunctionCall` 분기만 다룬다.
## 2. 책임 (단일 책임, 1줄)
Event 루프가 `LlmFunctionCall` 을 받았을 때, corpus 결과 (≥5/15) 가 prefix 보존을 정당화한 경우에만 `accumulated``ModelChatMessage` 로 push 한 뒤 tool 처리로 break.
## 3. 입력
| 파라미터 | 타입 | 제약/검증 | 설명 |
|----------|------|-----------|------|
| (loop local) `accumulated` | String | non-null, 빈 가능 | LlmTextChunk 누적 결과. |
| (loop local) `event` | LlmFunctionCall | non-null | Gemma 의 함수 호출 이벤트. |
| (instance) `logger` | `CorpusLogger?` | nullable | optional 진단. corpus 단계에서만 활성. |
| (instance) `state.messages` | `List<ChatMessage>` | non-null | 누적 메시지 history. |
## 4. 출력
- **반환**: 없음 (loop 내부 분기).
- **부수효과**:
- `logger?.onFunctionCall(...)` (corpus 활성 시).
- 경로 A: `state.messages``ModelChatMessage(accumulated)` append (단 trim 후 non-empty).
- 양 경로 공통: `toolCall = event; break;`.
## 5. 동작 / 알고리즘
### 경로 A (corpus 결과 ≥5/15 → push 채택)
```dart
} else if (event is LlmFunctionCall) {
toolCall = event;
// #312 — corpus 결과 X/15 (≥5) 가 의미있는 prefix → push.
logger?.onFunctionCall(turn, accumulated, event.name, event.args);
final trimmed = accumulated.trim();
if (trimmed.isNotEmpty) {
state = state.copyWith(
messages: [
...state.messages,
ModelChatMessage(trimmed),
],
);
}
break;
}
```
### 경로 B (corpus 결과 ≤4/15 → 폐기)
```dart
} else if (event is LlmFunctionCall) {
toolCall = event;
// #312 — corpus 측정 결과 X/15 만 의미있는 prefix → 의도적 폐기.
// ADR-0006 (docs/adr/0006-tool-call-prefix-discard.md) 참조.
// accumulated 는 버린다 — 회귀 가드는
// app/test/state/chat_session_prefix_test.dart 의 "폐기 회귀" 테스트.
logger?.onFunctionCall(turn, accumulated, event.name, event.args);
break;
}
```
`logger?.onTextChunk(turn, event.text)``LlmTextChunk` 분기에 동일하게 추가 (양 경로 공통).
### 양 경로 공통 추가 사항
- 컨트롤러 생성자에 optional `CorpusLogger? logger` 추가.
- Riverpod provider 가 `DebugCorpusLogger.maybeCreate()` 를 호출해 inject (production 에서는 null).
## 6. 에러 & 실패 모드
| 조건 | 처리 | 반환/예외 |
|------|------|-----------|
| `accumulated.trim()` 이 빈 문자열 | 경로 A 의 if 가드 → push 안 함 | 정상 break |
| `state.copyWith` 가 빈 messages 로 호출 | 정상 (no-op equivalent) | 정상 |
| logger 가 throw | logger 구현체 내부에서 swallow (fn-corpus_logger §6) | 정상 |
| `event.args` 가 null | `LlmFunctionCall` 계약상 non-null — 발생 시 LlmService 버그. catch 없음 (fail-fast). | LlmService 단에서 처리 |
## 7. 엣지케이스
- **빈 prefix 후 tool**: accumulated="" → 경로 A 의 trim guard 가 push 차단. ChatScreen 에 빈 버블 노출 안 됨.
- **whitespace only prefix** (`"\n\n "`): trim 후 empty → push 안 함.
- **prefix 가 multi-turn 루프의 turn 1+ 에서 발생**: 첫 turn 에서 tool 호출, 두 번째 turn 에서 LLM 이 또 prefix 후 tool 호출. 이때도 동일 로직 — accumulated 가 turn 별로 reset 되어 있음 (`var accumulated = '';` 가 for 루프 내부) 이므로 OK.
- **마지막 turn 의 prefix + 자연어 종료**: tool call 이 안 들어오고 `toolCall == null` 분기로 빠지면 기존 코드가 `ModelChatMessage(accumulated)` push — 본 설계와 무관.
- **prefix 가 그대로 사용자 입력 echo**: 운영 정의상 corpus 에서 N 으로 판정되나 구현은 echo 감지 안 함 (false positive 위험). 코드는 단순 trim/length 만.
## 8. 복잡도 / 성능
- 시간: O(accumulated.length) for trim. 무시 가능.
- 공간: `ModelChatMessage` 1개 (trim 된 prefix 길이).
- 호출 빈도: tool call 당 1회. userTurn 당 최대 `kChatMaxTurns` (4) 회.
## 9. 의존성
- 본 파일 (`chat_providers.dart`) 내 sealed `ChatMessage` (`UserChatMessage`/`ModelChatMessage`/`ToolCallChatMessage`).
- `LlmChatEvent` sealed class (`LlmTextChunk` / `LlmFunctionCall`).
- `CorpusLogger?` (fn-corpus_logger.md).
## 10. 테스트 케이스
- [ ] **경로 A happy**:
- Given: fake LlmService emit `[Text("수면 카탈로그를 보여드릴게요 "), FunctionCall("search_catalog", {"category":"sleep"})]`.
- When: `userTurn("수면 습관 추천")`.
- Then: `state.messages` 의 마지막 3 = `[UserChatMessage("수면 습관 추천"), ModelChatMessage("수면 카탈로그를 보여드릴게요"), ToolCallChatMessage("search_catalog", {category:"sleep"}, _)]`.
- [ ] **경로 A trim guard**:
- Given: fake emit `[Text("\n\n "), FunctionCall(...)]`.
- Then: `state.messages` 에 ModelChatMessage 추가 안 됨. 마지막 2 = `[User, ToolCall]`.
- [ ] **경로 A 빈 prefix**:
- Given: fake emit `[FunctionCall(...)]` (text chunk 없음).
- Then: state.messages 마지막 2 = `[User, ToolCall]`.
- [ ] **경로 B 폐기 회귀** (경로 B 채택 시):
- Given: fake emit `[Text("의미있는 한국어 prefix"), FunctionCall(...)]`.
- Then: state.messages 에 ModelChatMessage 없음 — corpus 결과로 폐기가 정당화됨을 명시적으로 assert.
> 모든 케이스는 mocked `LlmService` + 실제 ChatSessionController. 실 Gemma 통합은 corpus 수집 (Phase A) 에서 검증.
## 11. 추적성
- 인수조건: AC2 (조건부 구현), AC3 (단위 테스트).
- 관련 ADR: ADR-0006 (조건부 — 경로 B 채택 시).

View File

@@ -0,0 +1,116 @@
# 설계서: v0.4.2 hotfix — ChatScreen SafeArea + LLM 진단 + UX round 1 (#342)
> **상태**: Approved
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
> **추적성** — Redmine: #342 · 관련 ADR: 없음
> · 구현 파일: `app/lib/ui/screens/chat_screen.dart`, `app/lib/state/chat_providers.dart`, `app/lib/ui/labels.dart`, `app/lib/ui/screens/habit_list_screen.dart`, `app/lib/ui/screens/streak_screen.dart`, `app/lib/ui/screens/habit_create_screen.dart`
> · 테스트: 기존 167 회귀 (신규 추가 없음 — string label / SafeArea wrap 라 단위 가치 낮음)
## 1. 목적 (Why)
v0.4.1 실 단말 (Android, 사용자 본인) 첫 테스트에서 발견된 사용성·진단 격차 묶음. 모두 dev 단계 신속 hotfix.
1. **A — ChatScreen 입력창 가림**: edge-to-edge 모드의 시스템 nav bar 가 send 버튼/입력창을 덮어 사용 불가.
2. **B — LLM 실패 원인 불명**: warm-up 은 Ready 까지 가지만 send 실패 시 빨간 배너에 `LLM 응답 실패: <Type>` 만 떠 원인 진단 불가.
3. **C — UX round 1 (raw enum 노출)**: 습관 카드/스트릭/추가 화면이 Drift row 의 `'build'` / `RewardTier.dbValue('T0')` / `'Never miss twice'` 같은 식별자를 그대로 사용자에 노출.
## 2. 범위 (Scope)
- **포함**:
- A. `ChatScreen` Scaffold.body → `SafeArea(top: false, …)`.
- B. `userTurn` catch 가 `e.toString() + stack` 전체를 error state 에 저장. ChatScreen 빨간 배너를 `SingleChildScrollView + SelectableText` (monospace, 12pt, 최대 1/3 높이) 로 교체.
- C. `app/lib/ui/labels.dart` 신규 — `habitTypeLabel(HabitType)`, `habitTypeLabelFromDb(String)`, `rewardTierLabel(RewardTier)`. P0 3건 + P1 2건.
- D. UX round 2 — chat 빈 상태 안내 (예시 prompt 4 tap-to-fill), check_in 한국식 날짜 (`6월 15일 (월)`), habit_create "프레임 레벨" → "표현 방식" + 예시 부연.
- **제외 (out of scope)**:
- LLM `BackendInitException: model may be invalid` 실 원인 (GPU KV cache RESOURCE_EXHAUSTED 후보) — 단말 빌드/설치 비용 때문에 별도 사이클로 분리. follow-up 이슈 발행 예정.
- release 빌드에서 stack 숨김 (사용자 친화 메시지로 좁히기) — #342 종료 후 follow-up.
## 3. 인수조건 (Acceptance Criteria)
- [x] **AC-A1** Pixel/Galaxy gesture nav 단말에서 입력창 + send 버튼이 nav bar 와 겹치지 않음.
- [x] **AC-B1** send 실패 시 빨간 배너에 `LLM 응답 실패: <Type>\n<message>\n--- STACK ---\n<stack>` 표시. SelectableText 라 복사 가능.
- [x] **AC-B2** 빨간 배너 높이는 화면의 1/3 을 넘지 않고, 내부 스크롤로 전체 노출.
- [x] **AC-C1** 습관 카드 부제가 `build · L3 · …``만들기 · …` (frameLevel 식별자 제거).
- [x] **AC-C2** 스트릭 화면 현재 티어가 `T0` / `T1` (raw) → `🌱 새싹` / `🥉 3회 도전` ….
- [x] **AC-C3** 스트릭 화면 강등 경고가 `Never miss twice 발동 — 티어 강등``이틀 연속 빠졌어요. 한 단계 강등됐습니다.` (영문 잠언 제거).
- [x] **AC-C4** 습관 추가 드롭다운이 `만들기 (build)``만들기` (식별자 병기 제거).
- [x] **AC-C5** 스트릭 화면의 현재 스트릭이 `displayLarge` hero + 티어 라벨로 시각 위계 강조.
- [x] **AC-D1** ChatScreen 첫 진입 시 빈 메시지 리스트 대신 안내 (아이콘 + 한 줄 설명 + 예시 prompt 4개). tap → 입력창 자동 채움 (자동 send X — 사용자 수정 여지).
- [x] **AC-D2** CheckIn 화면 날짜 `2026-06-15` raw → `6월 15일 (월)` 한국식. DB 저장은 `_ymd` 유지.
- [x] **AC-D3** HabitCreate 의 `프레임 레벨``표현 방식` (+ helperText `행동 위주 vs 정체성 위주`). 아이템 라벨 `L2 · 조건부 긍정``조건부 행동 (예: 아침에 햇빛 받기)` 식 예시 포함.
- [x] **AC-D** 167 기존 테스트 회귀 없음, `flutter analyze` clean.
## 4. 컨텍스트 & 제약
- **의존성**: flutter_gemma 0.16.5 (B 변경 안 함), Riverpod 2.x, Drift row 의 raw String enum.
- **제약**:
- dev 단계 hotfix — release 노출 가능한 stack 도 허용 (사용자 본인 단말 진단 우선).
- C 의 라벨 매핑은 UI 레이어 단일 지점 (`ui/labels.dart`) — domain enum 에 `koreanLabel` 두지 않음 (관심사 분리).
- **가정**:
- `h.type` 은 Drift row 의 String — `HabitTypeX.dbValue` 와 동일한 wire 값 (`'build'` / `'break'`).
- `RewardTier` 의 사용자 명칭은 메모리상 5-Tier 정의 — 🌱 새싹 / 🥉 3회 / 🥈 7일 / 🥇 30일 / 🏆 6주 완주.
## 5. 아키텍처 개요
순수 string 매핑 + Widget tree 재구성. 신규 모듈 없음.
```
ChatScreen
├─ Scaffold.body — SafeArea(top: false) ← AC-A1
│ └─ Column
│ ├─ _WarmupErrorBanner (변경 없음)
│ ├─ Container(error) ← AC-B1/B2
│ │ constraints: maxHeight: screen/3
│ │ child: SingleChildScrollView(SelectableText, monospace 12pt)
│ └─ ListView (변경 없음)
ChatSessionController.userTurn ← AC-B1
└─ catch (e, st) → state.error = "LLM 응답 실패: ${e.runtimeType}\n$e\n\n--- STACK ---\n$st"
ui/labels.dart ← AC-C1~C4
├─ habitTypeLabel(HabitType) → '만들기' / '없애기'
├─ habitTypeLabelFromDb(String) → ↑ (Drift raw 분기, 기본 fallback = dbValue)
└─ rewardTierLabel(RewardTier) → '🌱 새싹' / '🥉 3회 도전' / … / '🏆 6주 완주'
habit_list_screen / streak_screen / habit_create_screen
└─ raw enum 노출 지점 모두 labels.dart 의 함수로 교체
```
## 6. 데이터 모델
신규 모델 없음. 매핑 도메인은 기존 enum (`HabitType`, `FrameLevel`, `RewardTier`) 의 표현 레이어만 분리.
| Enum | Raw (DB/wire) | UI 라벨 |
|---|---|---|
| `HabitType.build` | `'build'` | `만들기` |
| `HabitType.breakHabit` | `'break'` | `없애기` |
| `RewardTier.t0` | `'T0'` | `🌱 새싹` |
| `RewardTier.t1` | `'T1'` | `🥉 3회 도전` |
| `RewardTier.t2` | `'T2'` | `🥈 7일 형성` |
| `RewardTier.t3` | `'T3'` | `🥇 30일 정착` |
| `RewardTier.t4` | `'T4'` | `🏆 6주 완주` |
`FrameLevel` 은 본 hotfix 에서 UI 노출을 **제거** — 사용자에 의미 모호 (L2/L3 차이가 즉시 보이지 않음). 라벨 매핑 미작성.
## 7. 함수 명세
| 함수 | 책임 | 시그니처 | 복잡? |
|------|------|----------|-------|
| `habitTypeLabel` | enum → 한국어 라벨 | `String habitTypeLabel(HabitType)` | 단순 (switch) |
| `habitTypeLabelFromDb` | Drift raw String → 한국어 (fallback = raw) | `String habitTypeLabelFromDb(String)` | 단순 (switch + default) |
| `rewardTierLabel` | enum → 이모지+한국어 | `String rewardTierLabel(RewardTier)` | 단순 (switch) |
모두 단순 string switch 라 `fn-*.md` 분리 불필요.
## 8. 흐름 / 알고리즘
- A: `Scaffold.body``SafeArea` 로 감싸지면서 system bottom inset 만큼 padding 자동 적용. `top: false` 인 이유는 AppBar 가 이미 top inset 처리 (이중 padding 방지).
- B: `Future.try-catch (e, st)` 에서 stack trace 까지 함께 string concat → state → 빨간 컨테이너의 `SelectableText` 로 노출. 사용자가 텍스트 선택 → 복사해 외부에 공유 가능.
- C: 라벨 매핑은 분기/상태/I/O 없음. switch one-liner.
## 9. 테스트 전략
- 신규 unit 추가 없음 — 라벨 매핑은 상수 매핑이라 unit 가치 낮음.
- SafeArea + 빨간 배너는 widget 레이어 변경이지만 LLM 단말 시도 자체가 차단 상태 (#312 corpus collection blocker) — manual 검증으로 대체.
- 167 기존 테스트 회귀 없음으로 단위/통합/도메인 보호.
## 10. 후속 (v0.4.3 또는 별개 이슈)
- `BackendInitException: model may be invalid` 진단/수정 — `maxTokens=2048` 의 GPU buffer 후보. 단말 빌드 비용 때문에 분리.
- release 빌드에서 stack 숨김 (사용자 친화 메시지로).
## 11. 추적성
- **Redmine**: #342 (07-Release, dev hotfix bundle).
- **선행**: #311 (v0.4.1 warm-up — 빨간 배너 자체는 v0.4.1 에서 도입, 본 hotfix 가 진단성 강화).
- **관련**: #312 (corpus collection — LLM 동작 의존, B 진단 완료까지 블로커).

View File

@@ -0,0 +1,70 @@
# AI 코치와 대화하기 (사용자 가이드)
> 적용 버전: **v0.4.0 이상** (warm-up 은 **v0.4.1+**) · Redmine #260 / #311 · 관련 레퍼런스: [도구 호출](../reference/260-in-app-tool-calling.md) · [Warm-up](../reference/311-llm-warmup.md)
>
> 본 가이드는 v0.3.0 의 [AI 도움 켜기·끄기](ai-help-onboarding.md) 가 끝났다는 전제에서 시작합니다. 모델이 단말에 준비되어 있어야 합니다.
v0.4.0 부터는 자유 문장으로 AI 코치에게 카탈로그를 묻거나, 습관을 추가하거나, 오늘의 체크인을 기록할 수 있습니다. 모든 처리는 단말에서 일어나며 입력 텍스트는 외부로 나가지 않습니다.
## 진입
1. **습관 목록** 화면 진입.
2. AppBar 의 🤖 (smart toy) 아이콘 탭.
- AI 도움이 꺼져 있으면 아이콘이 보이지 않습니다 — [AI 도움 켜기](ai-help-onboarding.md) 먼저 진행해주세요.
## 가능한 대화 예시
- "아침 햇빛 프로토콜이 뭐야?" → AI 가 카탈로그에서 찾아 한국어로 요약.
- "수면 관련 습관 추천해줘" → 카테고리 검색 결과를 보여주고 어떤 것부터 시작할지 제안.
- "아침 햇빛 보기 습관 추가해줘" → **확인 다이얼로그가 떠야** 추가됩니다 (아래 §확인 게이트).
- "오늘 햇빛 체크해줘" → 같은 식의 확인 다이얼로그.
- "내 스트릭 어때?" → 현재 연속일수 + 5-tier 보상 등급 안내.
## 확인 게이트 (destructive actions)
다음 작업은 사용자의 명시적 확인 없이는 절대 수행되지 않습니다:
- **습관 추가** (`add_habit`)
- **체크 기록** (`log_tracker_entry`)
확인 다이얼로그가 뜨면:
- **수행** — 작업 진행
- **취소** — 작업 중단 (대화에는 `🛠 습관 추가 → 취소됨` 라벨이 남습니다)
- 바깥 영역 탭 = 취소
## 안전장치
- 한 대화당 최대 4번의 도구 호출 — 무한 루프 방지.
- 8 turn 도달 시 "대화가 길어졌어요" 안내 — 오른쪽 위 ↻ 로 새 대화 시작 권장 (이전 기록은 비워짐).
- AI 가 잘못된 인자로 도구를 호출하면 검증 오류 메시지를 모델에게 돌려주고, AI 가 다시 시도합니다. 앱이 죽지 않습니다.
- "술 끊기" 같은 회피 표현은 R7 규칙으로 자동 거부 + 긍정 프레임 제안 ("맑은 정신을 즐긴다" 등).
- 활성 build 습관 3개 / break 습관 1개 초과 시 R3 규칙으로 거부 — 기존 습관을 정리해야 추가 가능.
- 같은 날짜의 같은 습관에 두 번 체크하면 중복 안내 — 덮어쓰려면 기존 항목 삭제 후 다시 시도.
## 자주 묻는 질문
**Q. 대화 기록은 어디에 저장되나요?**
A. 메모리만 — 화면을 떠나거나 ↻ 를 누르면 사라집니다. 단말에 저장되지 않습니다.
**Q. AI 가 같은 도구를 계속 호출하면?**
A. 4 회를 넘기면 자동으로 멈추고 "도구 호출 루프가 너무 길어 중단했습니다" 안내가 뜹니다.
**Q. 응답이 너무 느린 것 같아요.**
A. 단말 모델이라 1턴 평균 2~5초가 정상입니다. AI 가 도구를 호출하면 round trip 이 한 번 더 들어가 6~10초가 될 수 있어요.
**Q. ChatScreen 진입 시 입력창에 "AI 준비 중…" 이 떠요.**
A. v0.4.1 부터 모델을 백그라운드로 미리 시동합니다 (warm-up). 첫 진입 시 한 번만 보이고 평균 2~8초 안에 사라집니다. 그동안 메시지를 미리 타이핑해도 되고, send 버튼만 비활성 상태로 기다립니다. 다시 진입하면 즉시 사용 가능합니다.
**Q. "AI 모델 파일을 찾을 수 없어요." / "AI 를 시작하지 못했어요." 가 떠요.**
A. 파일을 못 찾는 경우는 [설정으로 가기] 로 이동해 재다운로드, 일시적 시작 실패는 [다시 시도] 로 회복합니다. 설정에서 다운로드를 완료하고 돌아오면 자동으로 다시 시도합니다.
**Q. 도구 결과가 잘렸어요.**
A. 모델 컨텍스트 보호를 위해 도구 결과는 2KB 로 제한됩니다. 잘림이 발생하면 AI 가 자동으로 단건 조회 (`프로토콜 상세`) 도구를 다시 부르도록 안내됩니다.
## 관련 문서
- [AI 도움 켜기·끄기](ai-help-onboarding.md)
- 설계서: [docs/design/260-gemma-tool-calling/](../design/260-gemma-tool-calling/)
- 결정 기록: [docs/adr/0005-in-app-tool-calling-architecture.md](../adr/0005-in-app-tool-calling-architecture.md)
- API 레퍼런스: [docs/reference/260-in-app-tool-calling.md](../reference/260-in-app-tool-calling.md)
- 변경 이력: [CHANGELOG.md](../../CHANGELOG.md)

View File

@@ -0,0 +1,191 @@
# Reference: In-app tool calling (#260, v0.4.0)
> **상태**: 구현 후 동기화 · **추적성** — Redmine #260 · 설계서: [docs/design/260-gemma-tool-calling/](../design/260-gemma-tool-calling/) · ADR-0005 · 태그 `v0.4.0` (commit `7037b9e`)
>
> 본 문서는 v0.4.0 의 **실제 코드 사양**이다. 설계 의도/대안은 설계서·ADR 을 참조. 본 기능은 v0.3.0 의 AI 프레임 제안 ([215-ai-frame-suggest.md](215-ai-frame-suggest.md)) 위에 multi-turn tool calling 을 얹은 것이다.
## 1. 모듈 지도
```
lib/
ai/tools/
tool_definition.dart — ToolDefinition / ToolHandler / ToolDeps
tool_envelope.dart — ToolResult sealed (Ok/Err/Cancelled) + encodeToolResult (2KB cap)
tool_registry.dart — ToolRegistry.defaults() + 6 tool 모음
tool_dispatcher.dart — 라우팅 + JSON-schema 검증 + ConfirmGate 통합
confirm_gate.dart — destructive 호출 시 AlertDialog
catalog_tools.dart — search_catalog, query_protocol (read-only)
habit_tools.dart — add_habit (destructive), list_active_habits
tracker_tools.dart — log_tracker_entry (destructive), get_streak
data/ai/
llm_service.dart — LlmChatSession 추상 + LlmChatEvent sealed + MockLlmChatSession
gemma_llm_service.dart — _GemmaChatSession (flutter_gemma 0.16.5 + ToolChoice.auto)
state/
chat_providers.dart — ChatSessionController + kChatMaxTurns / kChatSoftHistoryLimit
ui/screens/
chat_screen.dart — AI 코치 화면 + _kToolKoreanLabels
```
## 2. 도메인 모델
### `ToolDefinition` (`lib/ai/tools/tool_definition.dart`)
```dart
class ToolDefinition {
final String name; // 'search_catalog'
final String description; // 모델이 보는 한국어 설명
final Map<String, dynamic> parametersSchema; // draft-07 JSON Schema Map 리터럴
final bool isDestructive; // true → ConfirmGate 의무
final ToolHandler handler; // Future<ToolResult> Function(args, deps)
final String Function(Map<String, dynamic>)? summarize; // confirm 모달 본문
}
```
### `ToolResult` (sealed)
```dart
sealed class ToolResult { Map<String, dynamic> toJson(); }
final class ToolOk extends ToolResult { final Map<String, dynamic> data; }
final class ToolErr extends ToolResult { final String code; final String reason; }
final class ToolCancelled extends ToolResult {}
```
`toJson()` 디스크리미네이터:
- ok → `{'status': 'ok', 'data': {...}}`
- error → `{'status': 'error', 'code': '...', 'reason': '...'}`
- cancel → `{'status': 'cancelled', 'reason': 'user did not confirm'}`
### `LlmChatEvent` (sealed)
```dart
sealed class LlmChatEvent {}
final class LlmTextChunk extends LlmChatEvent { final String text; }
final class LlmFunctionCall extends LlmChatEvent {
final String name;
final Map<String, dynamic> args;
}
```
## 3. 등록된 도구 6개
| 이름 | 종류 | parametersSchema (required) | 반환 (ok) |
|---|---|---|---|
| `search_catalog` | read-only | `category?`, `keyword?`, `limit?` (1~10) | `{count, items:[{id,title,category,summary}]}` |
| `query_protocol` | read-only | `id` | kind 별 필드 (`protocol` / `break` / `diet`) |
| `list_active_habits` | read-only | — | `{count, build_count, break_count, build_quota_remaining, break_quota_remaining, items[]}` |
| `get_streak` | read-only | `habit_id` | `{current_streak, longest_streak, done_count_30d, done_count_phase42, tier, never_miss_twice_broken}` |
| `add_habit` | **destructive** | `protocol_id`, `frame_level`, `framed_text`, `anchor_when?`, `anchor_after_what?`, `dose_text?` | `{habit_id, title, type, frame_level}` |
| `log_tracker_entry` | **destructive** | `habit_id`, `value`, `date?`, `note?` | `{entry_id, habit_id, date, value}` |
### R 규칙 enforce (핸들러 책임, ADR-0005 §D-2)
| R 규칙 | 위치 | ToolErr code |
|---|---|---|
| R3 (build ≤3 / break ≤1) | `_addHabitHandler``judgeActiveHabitQuota` | `r3_quota` |
| R5 (체크 (habit,date) 중복) | `_logTrackerEntryHandler` 핸들러 레벨 dedup | `duplicate` |
| R7 (회피 키워드) | `_addHabitHandler``detectAvoidanceKeywords(framePatterns)` | `r7_avoidance` |
| R8 (build XOR break protocol_id) | `HabitDao.insertWithVariants` assert → catch | `r8_xor` |
R1/R2/R4/R6/R9/R10 는 현재 본 surface 의 직접 enforce 범위 아님. R9/R10 (minimum variant) 는 UI 흐름에서 별도 관리 — 후속 이슈.
## 4. 멀티턴 루프
`ChatSessionController.userTurn(text, context)``lib/state/chat_providers.dart`.
```
1. 사용자 메시지 append + isStreaming=true
2. (lazy) llm.load() + _session = llm.startChat(tools)
3. nextStream = sendUser(trimmed)
4. for turn in 0..kChatMaxTurns:
events = nextStream()
if events.last is LlmTextChunk only:
모델 자연어 응답 append → return
if events has LlmFunctionCall(toolCall):
result = dispatcher.dispatch(toolCall.name, toolCall.args, context, deps)
messages append ToolCallChatMessage(name, args, result)
capped = jsonDecode(encodeToolResult(result)) ← AC-9 2KB cap
nextStream = sendToolResult(name, capped)
5. else: error('도구 호출 루프가 너무 길어 중단했습니다.')
```
- `kChatMaxTurns = 4` (안전 cap, ADR-0005 §C).
- `kChatSoftHistoryLimit = 8` — 사용자 turn 누적 8 회 도달 시 SystemChatMessage 한 줄 추가 ("대화가 길어졌어요").
- `LlmChatSession.sendToolResult``result` 는 항상 capped Map (`encodeToolResult` round-trip 결과).
## 5. ToolDispatcher 게이트
`lib/ai/tools/tool_dispatcher.dart``dispatch` 는 절대 throw 하지 않는다.
```
1. registry.byName → null 이면 ToolErr('unknown_tool')
2. _validateArgs(schema, rawArgs) → 실패 시 ToolErr('validation', ...)
3. tool.isDestructive 라면:
confirmContext==null → ToolCancelled
ConfirmGate.show(ctx, tool, rawArgs) == false → ToolCancelled
4. try handler(rawArgs, deps) — 예외 → ToolErr('handler_error', ...)
```
`_validateArgs` 의 지원 타입: `string` / `integer` / `number` / `boolean` / `object` / `array`. 미선언 키는 허용 (모델 환각 허용 — 핸들러가 무시).
## 6. ConfirmGate UI
`lib/ai/tools/confirm_gate.dart``showDialog<bool>` 기반 `AlertDialog`.
- 제목: `이 작업을 수행할까요?`
- 본문: `tool.description` + summary box (`tool.summarize?.call(args)` 또는 JSON fallback)
- 액션: `취소` (TextButton, false) / `수행` (FilledButton autofocus, true)
- `barrierDismissible: true` — 바깥 탭 = 취소
- 좁은 화면 대응: content 를 `SingleChildScrollView` 로 감쌈, summary box `width: double.infinity`
## 7. 2KB result cap (ADR-0005 §OQ-2)
`encodeToolResult(ToolResult, {int maxBytes = 2048})``lib/ai/tools/tool_envelope.dart`.
- `jsonEncode(result.toJson())` 후 길이가 `maxBytes` 이하면 그대로 반환.
- 초과 + `ToolOk` 이면 payload 를 `{'_truncated': true, '_hint': '... query_protocol 같은 단건 조회 도구를 사용하세요.'}` 로 대체.
- 초과 + 그 외 (방어용) → `substring(0, maxBytes)` hard cut.
- 호출 위치: `chat_providers.dart` `userTurn` 안에서 `jsonDecode(encodeToolResult(result))` 로 round-trip → Map 형태로 `sendToolResult` 전달.
> 주의: `.length` 는 UTF-16 code units. 한글 멀티바이트 utf-8 환산 시 더 작은 바이트 → 2048 cap 은 보수적 (안전 방향).
## 8. LlmChatSession 두 구현
| 구현 | 위치 | 비고 |
|---|---|---|
| `_GemmaChatSession` | `gemma_llm_service.dart` | flutter_gemma 0.16.5 `_chat.addQueryChunk` + `generateChatResponseAsync`. ParallelFunctionCallResponse 는 first 만 yield 후 return. ThinkingResponse skip. |
| `MockLlmChatSession` | `llm_service.dart` | 테스트용. `chatScript` (FIFO `List<List<LlmChatEvent>>`) + `userInputs` + `toolResults` 기록. `lastChat` 으로 마지막 세션 접근. |
`Tool` (flutter_gemma) ↔ `ToolDefinition` 매핑은 `startChat` 안에서 수행 (`name`, `description`, `parameters`).
## 9. UI 진입점
- `HabitListScreen` AppBar 의 🤖 IconButton (Icons.smart_toy_outlined) — `aiSettingsProvider == true` 일 때만 노출.
- 탭 → `ChatScreen` push.
- 새 대화: AppBar refresh 아이콘 (tooltip: `새 대화 (이전 기록 비우기)`) → `controller.clear()`.
- ToolCallChatMessage 라벨은 `_kToolKoreanLabels` 맵 기반 (`add_habit → 습관 추가` 등 6종, 미매핑은 raw name fallback).
## 10. 테스트
| 파일 | 케이스 수 |
|---|---|
| `test/ai/tools/tool_envelope_test.dart` | 6 |
| `test/ai/tools/catalog_tools_test.dart` | 7 |
| `test/ai/tools/habit_tools_test.dart` | 8 |
| `test/ai/tools/tracker_tools_test.dart` | 7 |
| `test/ai/tools/tool_dispatcher_test.dart` | 6 |
| `test/state/chat_session_controller_test.dart` | 8 (huge_dump cap 회귀 포함) |
| `test/ui/chat_screen_test.dart` | 2 (E2E 수행/취소) |
전체 v0.4.0 기준 **154 passed (1 skip)**.
## 11. Known limitations / 후속 이슈 권장
- **`ToolDefinition.koreanLabel` 필드 도입** — 현재 `chat_screen.dart``_kToolKoreanLabels` hardcoded const. 후속 tool 추가 시 두 위치 동기화 필요.
- **`log_tracker_entry` blank 시 confirm skip** — 현재 `isDestructive: true` 가 done/blank 무차별. R5 의도 "blank = 의도적 공란" 과 차이.
- **`search_catalog` category case-insensitive** — 현재 `DisplayCategory.name` 정확 일치. 모델 환각 대비.
- **R9/R10 minimum variant chat 노출** — Phase 1 dose variants UI 가 chat 진입점에 노출 안 됨. 핸들러는 `isMinimum:false` 고정.
- **KGP deprecation 경고** (빌드 시) — `device_info_plus`, `flutter_gemma`, `large_file_handler`. Future Flutter 빌드 실패 가능.
## 관련 문서
- 설계서: [docs/design/260-gemma-tool-calling/](../design/260-gemma-tool-calling/)
- 결정 기록: [docs/adr/0005-in-app-tool-calling-architecture.md](../adr/0005-in-app-tool-calling-architecture.md)
- 선행 레퍼런스: [docs/reference/215-ai-frame-suggest.md](215-ai-frame-suggest.md)
- 변경 이력: [CHANGELOG.md](../../CHANGELOG.md)

View File

@@ -0,0 +1,103 @@
# LLM warm-up (#311)
> 적용 버전: **v0.4.1 이상** · Redmine #311 · 설계서: [docs/design/311-llm-warmup/](../design/311-llm-warmup/)
`ChatScreen` 진입 시 LLM 모델을 백그라운드로 warm-up 하여 첫 send 의 cold native-init 비용 (수 초) 을 제거한다.
## 상태 머신
`app/lib/state/chat_warmup_provider.dart``sealed class ChatWarmupState`.
| 상태 | 진입 조건 | UI 동작 |
|------|-----------|---------|
| `Idle` | 초기값 | 평상 |
| `Loading` | `quickCheck = ready` + `llm.isLoaded = false``llm.load()` in-flight | hintText 교체, send 자리 spinner |
| `Ready` | `load()` 성공 또는 `llm.isLoaded = true` fast path | 평상, send 즉시 활성 |
| `Failed(kind)` | `load()` throw | `_WarmupErrorBanner` 표시 |
| `Unavailable` | `quickCheck != ready` (opt-out / downloading / missing) | 평상 (warmup 라벨 X, 기존 lazy 경로 fallback) |
`ChatWarmupFailureKind`:
- `fileMissing``FileSystemException`. 회복 = `SettingsScreen` push (재다운로드).
- `runtime` — 기타. 회복 = `retry()`.
## API
### `ChatWarmupController`
```dart
final chatWarmupProvider =
StateNotifierProvider.autoDispose<ChatWarmupController, ChatWarmupState>(...);
```
- `Future<void> start()` — quickCheck → load → state 전이. 재진입 가드 (Loading 중 호출은 no-op). `ChatScreen.initState``postFrameCallback` 에서 호출.
- `Future<void> retry()` — Idle reset 후 start() 재호출.
- dispose 시 `_disposed = true``_safeSet` 가 후속 state 변경 무시.
### `ModelLifecycle.quickCheck()`
```dart
Future<ModelAvailability> quickCheck();
```
`checkAvailability()` 의 lightweight 버전. SHA-256 재해싱 (~2.4GB) 을 건너뛰고 meta_kv + 파일 존재만으로 ready 추정. tamper 감지는 `checkAvailability()` 의 cold path (SettingsScreen) 에 위임.
| meta_kv 상태 | quickCheck 반환 |
|---|---|
| `ai_opt_in != 'true'` | `missing` |
| `ai_download_state in (downloading, paused)` | `downloading` |
| `ai_model_path` null | `missing` |
| `ai_model_sha256` null | `corrupt` |
| 파일 부재 | `missing` |
| 그 외 | `ready` |
| 내부 throw | `corrupt` (보수적 fallback) |
### Concurrent load guard
`GemmaLlmService.load()` + `MockLlmService.load()``_loadingFuture` 가드 공유:
```dart
Future<void> load() {
if (_loaded) return Future.value();
final existing = _loadingFuture;
if (existing != null) return existing;
final future = _doLoad();
_loadingFuture = future;
return future.whenComplete(() { _loadingFuture = null; });
}
```
ChatScreen warm-up + `userTurn` lazy load 가 race 해도 native init 1회만 실행. `_doLoad` throw 시 `whenComplete``_loadingFuture = null` 처리 → 다음 caller 가 새 시도.
## UI binding (`chat_screen.dart`)
- `TextField.enabled = !state.isStreaming` — warmup state 와 무관 (타이핑 미리 작성 가능, UX R1+R2).
- `hintText` 분기 — warmup loading 시 `AI 준비 중… 첫 시작은 몇 초 걸려요`, 그 외 평상.
- send 영역 — `state.isStreaming || isWarming` 이면 `CircularProgressIndicator(strokeWidth: 2)`, 그 외 `IconButton.filled`.
- `_WarmupErrorBanner` (`Failed` 일 때만 표시):
- 메시지 본문 = 상태 기술만 (명령형 X, AC12).
- 우측 정렬 `OutlinedButton`:
- `fileMissing``[설정으로 가기]` + `Navigator.push(SettingsScreen).then((_) => retry())` (pop 후 자동 retry).
- `runtime``[다시 시도]` + `retry()` (즉시).
## 마이크로카피
| 상황 | 한국어 |
|------|--------|
| warmup 중 hintText | `AI 준비 중… 첫 시작은 몇 초 걸려요` |
| 평상 hintText | `습관 추가, 기록, 카탈로그 질문…` |
| Failed(fileMissing) | `AI 모델 파일을 찾을 수 없어요.` |
| Failed(runtime) | `AI 를 시작하지 못했어요.` |
명령형 ("다시 시도해주세요" 등) 은 본문 금지 — 행동은 버튼이 담당.
## 테스트
- `app/test/state/chat_warmup_test.dart` — 8 unit (AC1-2, 5-7, 11-12 + retry + 재진입 가드).
- `app/test/data/ai/model_lifecycle_test.dart` — quickCheck 4 신규.
- `app/test/ui/chat_screen_test.dart` — widget E2E 보류 (NOTE comment 사유). `CircularProgressIndicator` 무한 ticker ↔ `pumpAndSettle` race 가 framework-level 한계.
## 관련 문서
- 설계서: [docs/design/311-llm-warmup/](../design/311-llm-warmup/)
- 사용자 가이드: [AI 코치와 대화하기](../guides/ai-chat-using.md)
- 변경 이력: [CHANGELOG.md](../../CHANGELOG.md) [0.4.1]