Compare commits
16 Commits
v0.1.27
...
91d9813253
| Author | SHA1 | Date | |
|---|---|---|---|
|
|
91d9813253 | ||
|
|
11e1cf7877 | ||
|
|
648ccde4d7 | ||
|
|
ed61d29632 | ||
|
|
51f7b5c7d3 | ||
|
|
f4cb95e88c | ||
|
|
109ad106ac | ||
|
|
319fd18258 | ||
|
|
0fa58a622c | ||
|
|
9743f96af7 | ||
|
|
e5dc0534c4 | ||
|
|
c88cb6ad54 | ||
|
|
079384b645 | ||
|
|
c7bd3c4c09 | ||
|
|
1a5db34e15 | ||
|
|
f126664117 |
48
CHANGELOG.md
48
CHANGELOG.md
@@ -6,6 +6,54 @@
|
|||||||
|
|
||||||
## 2026-06-15
|
## 2026-06-15
|
||||||
|
|
||||||
|
### ⚡ #326 parseJson 단일 패스 (v0.1.33)
|
||||||
|
- OciGenAiService.parseJson 잘린 배열 복구를 brace depth counter 단일 패스로 교체
|
||||||
|
- 이전 O(N²) + Jackson 예외 양산 → O(N) + 명시적 에러 경로
|
||||||
|
- 문자열/escape 처리 정확
|
||||||
|
- 설계서: docs/design/326-parsejson-optimization/README.md
|
||||||
|
- Refs: #326 (close)
|
||||||
|
|
||||||
|
### 🛡️ #332 Restaurant PUT 화이트리스트 명시 (v0.1.32)
|
||||||
|
- ALLOWED_UPDATE_FIELDS set으로 PUT /api/restaurants/{id} body 필터
|
||||||
|
- 허용 외 키 silent drop + DEBUG 로그
|
||||||
|
- sanitized.isEmpty()면 200 + no-op
|
||||||
|
- 후속 분리: #348 (DDG → 정식 API, isNameSimilar 한국어, DTO 표준화)
|
||||||
|
- Refs: #332 (close)
|
||||||
|
|
||||||
|
### 🛡️ #337 통계 봇 필터 + 레이트리밋 (v0.1.31)
|
||||||
|
- BotDetector: UA 정규식 (bot|crawler|spider|slurp|scrap|fetch|monitor|preview|lighthouse)
|
||||||
|
- RateLimitService: Redis SET NX EX(60s) 패턴, fail-open (의존성 최소화)
|
||||||
|
- StatsController.recordVisit: X-Forwarded-For 우선 IP + 봇/IP 가드
|
||||||
|
- 응답: {ok, counted:bool} — 차단도 200 (사용자 페이지 지장 X)
|
||||||
|
- application.yml: app.rate-limit.visit-window-seconds (기본 60)
|
||||||
|
- 운영 검증: Googlebot/Mozilla/즉시 재호출 인수조건 모두 충족
|
||||||
|
- 설계서: docs/design/337-stats-bot-ratelimit/README.md
|
||||||
|
- Refs: #337 (close)
|
||||||
|
|
||||||
|
### 🔒 #335 데몬 분산 락 ShedLock+Redis (v0.1.30)
|
||||||
|
- shedlock-spring 5.16.0 + shedlock-provider-redis-spring
|
||||||
|
- @EnableSchedulerLock(defaultLockAtMostFor=PT15M)
|
||||||
|
- DaemonScheduler.run: @SchedulerLock(name="daemon-runner", lockAtMostFor=PT15M, lockAtLeastFor=PT30S)
|
||||||
|
- ShedLockConfig: RedisLockProvider Bean (in-cluster Redis 재사용)
|
||||||
|
- 멀티 파드(RollingUpdate) + dev/prod ATP 공유 환경에서 데몬 중복 실행 차단
|
||||||
|
- 설계서: docs/design/335-daemon-distributed-lock/README.md
|
||||||
|
- Refs: #335 (close)
|
||||||
|
|
||||||
|
### 💾 #336 캐시 SCAN/UNLINK + 자동 복구 + 에러 메트릭 (v0.1.29)
|
||||||
|
- CacheService.flush: redis.keys() 블로킹 → SCAN cursor + UNLINK 논블로킹 (500 batch)
|
||||||
|
- @Scheduled(30s) checkHealth: Redis ping → disabled 자동 토글 (재기동 시 자동 복구)
|
||||||
|
- AtomicLong errorCount + volatile lastError + 로그 throttle (n==1 또는 n%100==0)
|
||||||
|
- GET /api/admin/cache/stats: disabled/errorCount/lastError 노출 (admin only)
|
||||||
|
- 설계서: docs/design/336-cache-scan-recovery/README.md
|
||||||
|
- Refs: #336 (close)
|
||||||
|
|
||||||
|
### 🔧 P5-2 작은 후속 (v0.1.26)
|
||||||
|
- #338: /api/version 신규 (HealthController + permitAll), application.yml app.build.{version,commit} env 주입 준비
|
||||||
|
- #320: findRegionFromCoords 거리 보정 (유클리드 → cos(lat) 가중치)
|
||||||
|
- #340: MapView 클러스터/마커/범례에 role/aria-label
|
||||||
|
- #333: ChannelController cache.flush() → cache.del("channels") (다른 모듈 캐시 보존)
|
||||||
|
- Refs: #338 #320 #340 #333 (close)
|
||||||
|
|
||||||
### 🧹 P5-1 작은 후속 묶음 (v0.1.24)
|
### 🧹 P5-1 작은 후속 묶음 (v0.1.24)
|
||||||
- #325: ThreadLocalRandom 통일, rebuildVectors not_implemented 이벤트, getTranscript JavaDoc 명세
|
- #325: ThreadLocalRandom 통일, rebuildVectors not_implemented 이벤트, getTranscript JavaDoc 명세
|
||||||
- #319: buildSearchQuery 헬퍼 + fn-doc(BottomSheet snap 정책)
|
- #319: buildSearchQuery 헬퍼 + fn-doc(BottomSheet snap 정책)
|
||||||
|
|||||||
@@ -28,6 +28,12 @@ dependencies {
|
|||||||
implementation 'org.springframework.boot:spring-boot-starter-data-redis'
|
implementation 'org.springframework.boot:spring-boot-starter-data-redis'
|
||||||
implementation 'org.springframework.boot:spring-boot-starter-validation'
|
implementation 'org.springframework.boot:spring-boot-starter-validation'
|
||||||
|
|
||||||
|
// #335 — 분산 락 (RollingUpdate 시 멀티 파드 공존 중 데몬 중복 실행 차단)
|
||||||
|
implementation 'net.javacrumbs.shedlock:shedlock-spring:5.16.0'
|
||||||
|
implementation 'net.javacrumbs.shedlock:shedlock-provider-redis-spring:5.16.0'
|
||||||
|
|
||||||
|
// #337 — IP 레이트리밋은 Redis SET NX EX 패턴으로 자체 구현 (기존 spring-data-redis 활용)
|
||||||
|
|
||||||
// Oracle JDBC + Security (Wallet support for Oracle ADB)
|
// Oracle JDBC + Security (Wallet support for Oracle ADB)
|
||||||
implementation 'com.oracle.database.jdbc:ojdbc11:23.7.0.25.01'
|
implementation 'com.oracle.database.jdbc:ojdbc11:23.7.0.25.01'
|
||||||
implementation 'com.oracle.database.security:oraclepki:23.7.0.25.01'
|
implementation 'com.oracle.database.security:oraclepki:23.7.0.25.01'
|
||||||
|
|||||||
@@ -1,5 +1,6 @@
|
|||||||
package com.tasteby;
|
package com.tasteby;
|
||||||
|
|
||||||
|
import net.javacrumbs.shedlock.spring.annotation.EnableSchedulerLock;
|
||||||
import org.springframework.boot.SpringApplication;
|
import org.springframework.boot.SpringApplication;
|
||||||
import org.springframework.boot.autoconfigure.SpringBootApplication;
|
import org.springframework.boot.autoconfigure.SpringBootApplication;
|
||||||
import org.springframework.scheduling.annotation.EnableAsync;
|
import org.springframework.scheduling.annotation.EnableAsync;
|
||||||
@@ -8,6 +9,8 @@ import org.springframework.scheduling.annotation.EnableScheduling;
|
|||||||
@SpringBootApplication
|
@SpringBootApplication
|
||||||
@EnableAsync
|
@EnableAsync
|
||||||
@EnableScheduling
|
@EnableScheduling
|
||||||
|
// #335 — defaultLockAtMostFor: 어떤 작업이 lockAtMostFor 명시 안 해도 보호 (안전 마진)
|
||||||
|
@EnableSchedulerLock(defaultLockAtMostFor = "PT15M")
|
||||||
public class TastebyApplication {
|
public class TastebyApplication {
|
||||||
public static void main(String[] args) {
|
public static void main(String[] args) {
|
||||||
SpringApplication.run(TastebyApplication.class, args);
|
SpringApplication.run(TastebyApplication.class, args);
|
||||||
|
|||||||
@@ -0,0 +1,22 @@
|
|||||||
|
package com.tasteby.config;
|
||||||
|
|
||||||
|
import net.javacrumbs.shedlock.core.LockProvider;
|
||||||
|
import net.javacrumbs.shedlock.provider.redis.spring.RedisLockProvider;
|
||||||
|
import org.springframework.context.annotation.Bean;
|
||||||
|
import org.springframework.context.annotation.Configuration;
|
||||||
|
import org.springframework.data.redis.connection.RedisConnectionFactory;
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #335 — ShedLock LockProvider (Redis 기반).
|
||||||
|
*
|
||||||
|
* 데몬 스케줄러가 다중 파드 환경에서 한 번에 하나만 실행되도록 보장.
|
||||||
|
* key prefix는 ShedLock 기본 ("lock:")을 사용 → Redis 키는 `lock:daemon-runner`.
|
||||||
|
*/
|
||||||
|
@Configuration
|
||||||
|
public class ShedLockConfig {
|
||||||
|
|
||||||
|
@Bean
|
||||||
|
public LockProvider lockProvider(RedisConnectionFactory connectionFactory) {
|
||||||
|
return new RedisLockProvider(connectionFactory);
|
||||||
|
}
|
||||||
|
}
|
||||||
@@ -22,4 +22,14 @@ public class AdminCacheController {
|
|||||||
cacheService.flush();
|
cacheService.flush();
|
||||||
return Map.of("ok", true);
|
return Map.of("ok", true);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #336 — 캐시 상태 가시화: disabled / errorCount / lastError.
|
||||||
|
* 외부 모니터링 도구 도입 전 운영자가 어드민에서 확인 가능.
|
||||||
|
*/
|
||||||
|
@GetMapping("/cache/stats")
|
||||||
|
public CacheService.CacheStats cacheStats() {
|
||||||
|
AuthUtil.requireAdmin();
|
||||||
|
return cacheService.getStats();
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|||||||
@@ -90,15 +90,34 @@ public class RestaurantController {
|
|||||||
return r;
|
return r;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// #332 — Restaurant 업데이트 화이트리스트 (SQL updateFields의 컬럼 가드와 1:1).
|
||||||
|
// 허용되지 않은 키는 무시(silent drop). DTO 도입은 후속 작업.
|
||||||
|
private static final java.util.Set<String> ALLOWED_UPDATE_FIELDS = java.util.Set.of(
|
||||||
|
"name", "address", "region", "cuisine_type", "price_range",
|
||||||
|
"phone", "website", "tabling_url", "catchtable_url",
|
||||||
|
"latitude", "longitude", "google_place_id",
|
||||||
|
"business_status", "rating", "rating_count"
|
||||||
|
);
|
||||||
|
|
||||||
@PutMapping("/{id}")
|
@PutMapping("/{id}")
|
||||||
public Map<String, Object> update(@PathVariable String id, @RequestBody Map<String, Object> body) {
|
public Map<String, Object> update(@PathVariable String id, @RequestBody Map<String, Object> body) {
|
||||||
AuthUtil.requireAdmin();
|
AuthUtil.requireAdmin();
|
||||||
var r = restaurantService.findById(id);
|
var r = restaurantService.findById(id);
|
||||||
if (r == null) throw new ResponseStatusException(HttpStatus.NOT_FOUND, "Restaurant not found");
|
if (r == null) throw new ResponseStatusException(HttpStatus.NOT_FOUND, "Restaurant not found");
|
||||||
|
|
||||||
|
// #332 — 입력 body를 허용 키만 통과시킨 가변 Map으로 정규화
|
||||||
|
Map<String, Object> sanitized = new java.util.LinkedHashMap<>();
|
||||||
|
for (var e : body.entrySet()) {
|
||||||
|
if (ALLOWED_UPDATE_FIELDS.contains(e.getKey())) {
|
||||||
|
sanitized.put(e.getKey(), e.getValue());
|
||||||
|
} else {
|
||||||
|
log.debug("Ignoring non-whitelisted update field: {}", e.getKey());
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
// Re-geocode if name or address changed
|
// Re-geocode if name or address changed
|
||||||
String newName = (String) body.get("name");
|
String newName = (String) sanitized.get("name");
|
||||||
String newAddress = (String) body.get("address");
|
String newAddress = (String) sanitized.get("address");
|
||||||
boolean nameChanged = newName != null && !newName.equals(r.getName());
|
boolean nameChanged = newName != null && !newName.equals(r.getName());
|
||||||
boolean addressChanged = newAddress != null && !newAddress.equals(r.getAddress());
|
boolean addressChanged = newAddress != null && !newAddress.equals(r.getAddress());
|
||||||
if (nameChanged || addressChanged) {
|
if (nameChanged || addressChanged) {
|
||||||
@@ -106,26 +125,30 @@ public class RestaurantController {
|
|||||||
String geoAddr = newAddress != null ? newAddress : r.getAddress();
|
String geoAddr = newAddress != null ? newAddress : r.getAddress();
|
||||||
var geo = geocodingService.geocodeRestaurant(geoName, geoAddr);
|
var geo = geocodingService.geocodeRestaurant(geoName, geoAddr);
|
||||||
if (geo != null) {
|
if (geo != null) {
|
||||||
body.put("latitude", geo.get("latitude"));
|
sanitized.put("latitude", geo.get("latitude"));
|
||||||
body.put("longitude", geo.get("longitude"));
|
sanitized.put("longitude", geo.get("longitude"));
|
||||||
body.put("google_place_id", geo.get("google_place_id"));
|
sanitized.put("google_place_id", geo.get("google_place_id"));
|
||||||
if (geo.containsKey("formatted_address")) {
|
if (geo.containsKey("formatted_address")) {
|
||||||
body.put("address", geo.get("formatted_address"));
|
sanitized.put("address", geo.get("formatted_address"));
|
||||||
}
|
}
|
||||||
if (geo.containsKey("rating")) body.put("rating", geo.get("rating"));
|
if (geo.containsKey("rating")) sanitized.put("rating", geo.get("rating"));
|
||||||
if (geo.containsKey("rating_count")) body.put("rating_count", geo.get("rating_count"));
|
if (geo.containsKey("rating_count")) sanitized.put("rating_count", geo.get("rating_count"));
|
||||||
if (geo.containsKey("phone")) body.put("phone", geo.get("phone"));
|
if (geo.containsKey("phone")) sanitized.put("phone", geo.get("phone"));
|
||||||
if (geo.containsKey("business_status")) body.put("business_status", geo.get("business_status"));
|
if (geo.containsKey("business_status")) sanitized.put("business_status", geo.get("business_status"));
|
||||||
|
|
||||||
// formatted_address에서 region 파싱 (예: "대한민국 서울특별시 강남구 ..." → "한국|서울|강남구")
|
|
||||||
String addr = (String) geo.get("formatted_address");
|
String addr = (String) geo.get("formatted_address");
|
||||||
if (addr != null) {
|
if (addr != null) {
|
||||||
body.put("region", GeocodingService.parseRegionFromAddress(addr));
|
sanitized.put("region", GeocodingService.parseRegionFromAddress(addr));
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
restaurantService.update(id, body);
|
if (sanitized.isEmpty()) {
|
||||||
|
// 허용 키가 하나도 없으면 no-op
|
||||||
|
return Map.of("ok", true, "restaurant", r);
|
||||||
|
}
|
||||||
|
|
||||||
|
restaurantService.update(id, sanitized);
|
||||||
cache.flush();
|
cache.flush();
|
||||||
var updated = restaurantService.findById(id);
|
var updated = restaurantService.findById(id);
|
||||||
return Map.of("ok", true, "restaurant", updated);
|
return Map.of("ok", true, "restaurant", updated);
|
||||||
|
|||||||
@@ -1,7 +1,12 @@
|
|||||||
package com.tasteby.controller;
|
package com.tasteby.controller;
|
||||||
|
|
||||||
import com.tasteby.domain.SiteVisitStats;
|
import com.tasteby.domain.SiteVisitStats;
|
||||||
|
import com.tasteby.service.RateLimitService;
|
||||||
import com.tasteby.service.StatsService;
|
import com.tasteby.service.StatsService;
|
||||||
|
import com.tasteby.util.BotDetector;
|
||||||
|
import jakarta.servlet.http.HttpServletRequest;
|
||||||
|
import org.slf4j.Logger;
|
||||||
|
import org.slf4j.LoggerFactory;
|
||||||
import org.springframework.web.bind.annotation.*;
|
import org.springframework.web.bind.annotation.*;
|
||||||
|
|
||||||
import java.util.Map;
|
import java.util.Map;
|
||||||
@@ -10,20 +15,51 @@ import java.util.Map;
|
|||||||
@RequestMapping("/api/stats")
|
@RequestMapping("/api/stats")
|
||||||
public class StatsController {
|
public class StatsController {
|
||||||
|
|
||||||
private final StatsService statsService;
|
private static final Logger log = LoggerFactory.getLogger(StatsController.class);
|
||||||
|
|
||||||
public StatsController(StatsService statsService) {
|
private final StatsService statsService;
|
||||||
|
private final RateLimitService rateLimitService;
|
||||||
|
|
||||||
|
public StatsController(StatsService statsService, RateLimitService rateLimitService) {
|
||||||
this.statsService = statsService;
|
this.statsService = statsService;
|
||||||
|
this.rateLimitService = rateLimitService;
|
||||||
}
|
}
|
||||||
|
|
||||||
@PostMapping("/visit")
|
@PostMapping("/visit")
|
||||||
public Map<String, Object> recordVisit() {
|
public Map<String, Object> recordVisit(HttpServletRequest req) {
|
||||||
|
// #337 — 봇 UA + IP 레이트리밋. 모두 통과해야 카운트 진행.
|
||||||
|
String ua = req.getHeader("User-Agent");
|
||||||
|
if (BotDetector.isBot(ua)) {
|
||||||
|
log.debug("visit skipped (bot): {}", ua);
|
||||||
|
return Map.of("ok", true, "counted", false);
|
||||||
|
}
|
||||||
|
|
||||||
|
String clientIp = resolveClientIp(req);
|
||||||
|
if (!rateLimitService.tryConsume(clientIp)) {
|
||||||
|
log.debug("visit skipped (rate-limit): {}", clientIp);
|
||||||
|
return Map.of("ok", true, "counted", false);
|
||||||
|
}
|
||||||
|
|
||||||
statsService.recordVisit();
|
statsService.recordVisit();
|
||||||
return Map.of("ok", true);
|
return Map.of("ok", true, "counted", true);
|
||||||
}
|
}
|
||||||
|
|
||||||
@GetMapping("/visits")
|
@GetMapping("/visits")
|
||||||
public SiteVisitStats getVisits() {
|
public SiteVisitStats getVisits() {
|
||||||
return statsService.getVisits();
|
return statsService.getVisits();
|
||||||
}
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #337 — X-Forwarded-For 우선 (Nginx Ingress 뒤). chain이면 첫 번째(원본).
|
||||||
|
* 없으면 RemoteAddr 폴백.
|
||||||
|
*/
|
||||||
|
private static String resolveClientIp(HttpServletRequest req) {
|
||||||
|
String fwd = req.getHeader("X-Forwarded-For");
|
||||||
|
if (fwd != null && !fwd.isBlank()) {
|
||||||
|
int comma = fwd.indexOf(',');
|
||||||
|
return (comma > 0 ? fwd.substring(0, comma) : fwd).trim();
|
||||||
|
}
|
||||||
|
String addr = req.getRemoteAddr();
|
||||||
|
return addr != null ? addr : "unknown";
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|||||||
@@ -5,46 +5,46 @@ import com.fasterxml.jackson.databind.ObjectMapper;
|
|||||||
import org.slf4j.Logger;
|
import org.slf4j.Logger;
|
||||||
import org.slf4j.LoggerFactory;
|
import org.slf4j.LoggerFactory;
|
||||||
import org.springframework.beans.factory.annotation.Value;
|
import org.springframework.beans.factory.annotation.Value;
|
||||||
|
import org.springframework.data.redis.connection.RedisConnectionFactory;
|
||||||
|
import org.springframework.data.redis.core.Cursor;
|
||||||
|
import org.springframework.data.redis.core.ScanOptions;
|
||||||
import org.springframework.data.redis.core.StringRedisTemplate;
|
import org.springframework.data.redis.core.StringRedisTemplate;
|
||||||
|
import org.springframework.scheduling.annotation.Scheduled;
|
||||||
import org.springframework.stereotype.Service;
|
import org.springframework.stereotype.Service;
|
||||||
|
|
||||||
|
import java.nio.charset.StandardCharsets;
|
||||||
import java.time.Duration;
|
import java.time.Duration;
|
||||||
import java.util.Set;
|
import java.util.ArrayList;
|
||||||
|
import java.util.List;
|
||||||
|
import java.util.concurrent.atomic.AtomicLong;
|
||||||
|
|
||||||
@Service
|
@Service
|
||||||
public class CacheService {
|
public class CacheService {
|
||||||
|
|
||||||
private static final Logger log = LoggerFactory.getLogger(CacheService.class);
|
private static final Logger log = LoggerFactory.getLogger(CacheService.class);
|
||||||
private static final String PREFIX = "tasteby:";
|
private static final String PREFIX = "tasteby:";
|
||||||
|
private static final String SCAN_PATTERN = PREFIX + "*";
|
||||||
|
private static final int SCAN_BATCH = 500;
|
||||||
|
|
||||||
private final StringRedisTemplate redis;
|
private final StringRedisTemplate redis;
|
||||||
private final ObjectMapper mapper;
|
private final ObjectMapper mapper;
|
||||||
private final Duration ttl;
|
private final Duration ttl;
|
||||||
private boolean disabled = false;
|
|
||||||
|
// #336 — disabled/errorCount/lastError는 헬스체크와 다른 호출 스레드 사이에서 안전하게 공유.
|
||||||
|
private volatile boolean disabled = false;
|
||||||
|
private final AtomicLong errorCount = new AtomicLong(0);
|
||||||
|
private volatile String lastError = null;
|
||||||
|
|
||||||
public CacheService(StringRedisTemplate redis, ObjectMapper mapper,
|
public CacheService(StringRedisTemplate redis, ObjectMapper mapper,
|
||||||
@Value("${app.cache.ttl-seconds:600}") int ttlSeconds) {
|
@Value("${app.cache.ttl-seconds:600}") int ttlSeconds) {
|
||||||
this.redis = redis;
|
this.redis = redis;
|
||||||
this.mapper = mapper;
|
this.mapper = mapper;
|
||||||
this.ttl = Duration.ofSeconds(ttlSeconds);
|
this.ttl = Duration.ofSeconds(ttlSeconds);
|
||||||
// #276 — ping 연결 자원 누수 방지: try-with-resources
|
this.disabled = !pingOk();
|
||||||
var factory = redis.getConnectionFactory();
|
if (!disabled) log.info("Redis connected");
|
||||||
if (factory == null) {
|
|
||||||
log.warn("Redis ConnectionFactory is null, caching disabled");
|
|
||||||
disabled = true;
|
|
||||||
return;
|
|
||||||
}
|
|
||||||
try (var conn = factory.getConnection()) {
|
|
||||||
conn.ping();
|
|
||||||
log.info("Redis connected");
|
|
||||||
} catch (Exception e) {
|
|
||||||
log.warn("Redis unavailable ({}), caching disabled", e.getMessage());
|
|
||||||
disabled = true;
|
|
||||||
}
|
|
||||||
}
|
}
|
||||||
|
|
||||||
public String makeKey(String... parts) {
|
public String makeKey(String... parts) {
|
||||||
// #276 — null/빈 파트로 "tasteby::" 같은 잘못된 키 생성 방지
|
|
||||||
if (parts == null || parts.length == 0) {
|
if (parts == null || parts.length == 0) {
|
||||||
throw new IllegalArgumentException("makeKey requires at least one part");
|
throw new IllegalArgumentException("makeKey requires at least one part");
|
||||||
}
|
}
|
||||||
@@ -62,7 +62,7 @@ public class CacheService {
|
|||||||
return mapper.readValue(val, type);
|
return mapper.readValue(val, type);
|
||||||
}
|
}
|
||||||
} catch (Exception e) {
|
} catch (Exception e) {
|
||||||
log.debug("Cache get error: {}", e.getMessage());
|
recordError("get", e);
|
||||||
}
|
}
|
||||||
return null;
|
return null;
|
||||||
}
|
}
|
||||||
@@ -72,7 +72,7 @@ public class CacheService {
|
|||||||
try {
|
try {
|
||||||
return redis.opsForValue().get(key);
|
return redis.opsForValue().get(key);
|
||||||
} catch (Exception e) {
|
} catch (Exception e) {
|
||||||
log.debug("Cache get error: {}", e.getMessage());
|
recordError("getRaw", e);
|
||||||
return null;
|
return null;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
@@ -83,30 +83,114 @@ public class CacheService {
|
|||||||
String json = mapper.writeValueAsString(value);
|
String json = mapper.writeValueAsString(value);
|
||||||
redis.opsForValue().set(key, json, ttl);
|
redis.opsForValue().set(key, json, ttl);
|
||||||
} catch (JsonProcessingException e) {
|
} catch (JsonProcessingException e) {
|
||||||
log.debug("Cache set error: {}", e.getMessage());
|
recordError("set:serialize", e);
|
||||||
|
} catch (Exception e) {
|
||||||
|
recordError("set", e);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #336 — KEYS 블로킹 명령 대체.
|
||||||
|
* SCAN으로 cursor 순회 후 UNLINK(논블로킹 삭제)로 일괄 삭제.
|
||||||
|
*/
|
||||||
public void flush() {
|
public void flush() {
|
||||||
if (disabled) return;
|
if (disabled) return;
|
||||||
try {
|
Integer count = redis.execute((org.springframework.data.redis.core.RedisCallback<Integer>) conn -> {
|
||||||
Set<String> keys = redis.keys(PREFIX + "*");
|
List<byte[]> batch = new ArrayList<>(SCAN_BATCH);
|
||||||
if (keys != null && !keys.isEmpty()) {
|
int deleted = 0;
|
||||||
redis.delete(keys);
|
try (Cursor<byte[]> cursor = conn.keyCommands().scan(
|
||||||
|
ScanOptions.scanOptions().match(SCAN_PATTERN).count(SCAN_BATCH).build())) {
|
||||||
|
while (cursor.hasNext()) {
|
||||||
|
batch.add(cursor.next());
|
||||||
|
if (batch.size() >= SCAN_BATCH) {
|
||||||
|
deleted += unlinkBatch(conn, batch);
|
||||||
|
batch.clear();
|
||||||
|
}
|
||||||
|
}
|
||||||
|
if (!batch.isEmpty()) {
|
||||||
|
deleted += unlinkBatch(conn, batch);
|
||||||
|
}
|
||||||
|
} catch (Exception e) {
|
||||||
|
recordError("flush:scan", e);
|
||||||
}
|
}
|
||||||
log.info("Cache flushed");
|
return deleted;
|
||||||
|
});
|
||||||
|
log.info("Cache flushed ({} keys via SCAN+UNLINK)", count == null ? 0 : count);
|
||||||
|
}
|
||||||
|
|
||||||
|
private int unlinkBatch(org.springframework.data.redis.connection.RedisConnection conn, List<byte[]> keys) {
|
||||||
|
try {
|
||||||
|
Long n = conn.keyCommands().unlink(keys.toArray(new byte[0][]));
|
||||||
|
return n == null ? 0 : n.intValue();
|
||||||
} catch (Exception e) {
|
} catch (Exception e) {
|
||||||
log.debug("Cache flush error: {}", e.getMessage());
|
// UNLINK 미지원 환경 대비 DEL 폴백
|
||||||
|
recordError("flush:unlink", e);
|
||||||
|
try {
|
||||||
|
Long n = conn.keyCommands().del(keys.toArray(new byte[0][]));
|
||||||
|
return n == null ? 0 : n.intValue();
|
||||||
|
} catch (Exception delErr) {
|
||||||
|
recordError("flush:del", delErr);
|
||||||
|
return 0;
|
||||||
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
// #290 — 단일 키 삭제 (캐시 역직렬화 실패 시 자동 evict 등에 사용)
|
|
||||||
public void del(String key) {
|
public void del(String key) {
|
||||||
if (disabled) return;
|
if (disabled) return;
|
||||||
try {
|
try {
|
||||||
redis.delete(key);
|
redis.delete(key);
|
||||||
} catch (Exception e) {
|
} catch (Exception e) {
|
||||||
log.debug("Cache del error: {}", e.getMessage());
|
recordError("del", e);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #336 — Redis 다운 → disabled=true, 재기동되면 자동으로 disabled=false.
|
||||||
|
* 30초마다 ping 한 번(<1ms)이라 부하 미미.
|
||||||
|
*/
|
||||||
|
@Scheduled(fixedDelay = 30_000L)
|
||||||
|
public void checkHealth() {
|
||||||
|
boolean ok = pingOk();
|
||||||
|
if (ok && disabled) {
|
||||||
|
disabled = false;
|
||||||
|
log.info("Redis recovered, caching re-enabled");
|
||||||
|
} else if (!ok && !disabled) {
|
||||||
|
disabled = true;
|
||||||
|
log.warn("Redis lost, caching disabled");
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
private boolean pingOk() {
|
||||||
|
RedisConnectionFactory factory = redis.getConnectionFactory();
|
||||||
|
if (factory == null) return false;
|
||||||
|
try (var conn = factory.getConnection()) {
|
||||||
|
conn.ping();
|
||||||
|
return true;
|
||||||
|
} catch (Exception e) {
|
||||||
|
lastError = "ping: " + e.getMessage();
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
private void recordError(String op, Exception e) {
|
||||||
|
long n = errorCount.incrementAndGet();
|
||||||
|
String msg = e.getMessage();
|
||||||
|
lastError = op + ": " + (msg == null ? e.getClass().getSimpleName() : msg);
|
||||||
|
// 한 번씩만 WARN, 나머지는 DEBUG로 (운영 로그 폭주 방지 — 단순한 throttle)
|
||||||
|
if (n == 1 || n % 100 == 0) {
|
||||||
|
log.warn("Cache {} error #{}: {}", op, n, lastError);
|
||||||
|
} else {
|
||||||
|
log.debug("Cache {} error #{}: {}", op, n, lastError);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
public boolean isDisabled() {
|
||||||
|
return disabled;
|
||||||
|
}
|
||||||
|
|
||||||
|
public CacheStats getStats() {
|
||||||
|
return new CacheStats(disabled, errorCount.get(), lastError);
|
||||||
|
}
|
||||||
|
|
||||||
|
public record CacheStats(boolean disabled, long errorCount, String lastError) {}
|
||||||
}
|
}
|
||||||
|
|||||||
@@ -1,6 +1,7 @@
|
|||||||
package com.tasteby.service;
|
package com.tasteby.service;
|
||||||
|
|
||||||
import com.tasteby.domain.DaemonConfig;
|
import com.tasteby.domain.DaemonConfig;
|
||||||
|
import net.javacrumbs.shedlock.spring.annotation.SchedulerLock;
|
||||||
import org.slf4j.Logger;
|
import org.slf4j.Logger;
|
||||||
import org.slf4j.LoggerFactory;
|
import org.slf4j.LoggerFactory;
|
||||||
import org.springframework.beans.factory.annotation.Value;
|
import org.springframework.beans.factory.annotation.Value;
|
||||||
@@ -37,6 +38,10 @@ public class DaemonScheduler {
|
|||||||
}
|
}
|
||||||
|
|
||||||
@Scheduled(fixedDelay = 30_000) // Check every 30 seconds
|
@Scheduled(fixedDelay = 30_000) // Check every 30 seconds
|
||||||
|
// #335 — 분산 락: 멀티 파드 환경에서 한 인스턴스만 실행. Redis 키 `lock:daemon-runner`.
|
||||||
|
// lockAtMostFor: 작업이 비정상 종료돼도 15분 후 강제 해제 (다음 cron이 잡을 수 있게)
|
||||||
|
// lockAtLeastFor: 빨리 끝나도 30초 동안 유지 (즉시 다른 cron이 같은 작업 잡는 것 방지)
|
||||||
|
@SchedulerLock(name = "daemon-runner", lockAtMostFor = "PT15M", lockAtLeastFor = "PT30S")
|
||||||
public void run() {
|
public void run() {
|
||||||
// 인스턴스 차원 차단(dev/prod 동일 DB 공유 환경에서 dev 쪽 동시 폴링 방지).
|
// 인스턴스 차원 차단(dev/prod 동일 DB 공유 환경에서 dev 쪽 동시 폴링 방지).
|
||||||
// dev .env: DAEMON_ENABLED=false → 이 인스턴스는 스케줄러 동작 안 함.
|
// dev .env: DAEMON_ENABLED=false → 이 인스턴스는 스케줄러 동작 안 함.
|
||||||
|
|||||||
@@ -150,26 +150,25 @@ public class OciGenAiService {
|
|||||||
return mapper.readValue(raw, Object.class);
|
return mapper.readValue(raw, Object.class);
|
||||||
} catch (Exception ignored) {}
|
} catch (Exception ignored) {}
|
||||||
|
|
||||||
// Try to recover truncated array
|
// #326 — Recover truncated array. Brace depth counter로 단일 패스 O(N).
|
||||||
|
// 이전: 각 idx에서 end를 1씩 늘려가며 매번 readValue → O(N²) + 예외 스택트레이스 양산.
|
||||||
if (raw.trim().startsWith("[")) {
|
if (raw.trim().startsWith("[")) {
|
||||||
List<Object> items = new ArrayList<>();
|
List<Object> items = new ArrayList<>();
|
||||||
int idx = raw.indexOf('[') + 1;
|
int idx = raw.indexOf('[') + 1;
|
||||||
while (idx < raw.length()) {
|
while (idx < raw.length()) {
|
||||||
while (idx < raw.length() && " \t\n\r,".indexOf(raw.charAt(idx)) >= 0) idx++;
|
while (idx < raw.length() && " \t\n\r,".indexOf(raw.charAt(idx)) >= 0) idx++;
|
||||||
if (idx >= raw.length() || raw.charAt(idx) == ']') break;
|
if (idx >= raw.length() || raw.charAt(idx) == ']') break;
|
||||||
|
if (raw.charAt(idx) != '{') break; // 객체 시작이 아니면 복구 중단
|
||||||
|
|
||||||
// Try to parse next object
|
int end = findObjectEnd(raw, idx);
|
||||||
boolean found = false;
|
if (end < 0) break; // 잘린 객체 — 거기서 멈춤
|
||||||
for (int end = idx + 1; end <= raw.length(); end++) {
|
try {
|
||||||
try {
|
Object obj = mapper.readValue(raw.substring(idx, end + 1), Object.class);
|
||||||
Object obj = mapper.readValue(raw.substring(idx, end), Object.class);
|
items.add(obj);
|
||||||
items.add(obj);
|
} catch (Exception ignored2) {
|
||||||
idx = end;
|
break; // 불가해 객체 — 멈춤
|
||||||
found = true;
|
|
||||||
break;
|
|
||||||
} catch (Exception ignored2) {}
|
|
||||||
}
|
}
|
||||||
if (!found) break;
|
idx = end + 1;
|
||||||
}
|
}
|
||||||
if (!items.isEmpty()) {
|
if (!items.isEmpty()) {
|
||||||
log.info("Recovered {} items from truncated JSON", items.size());
|
log.info("Recovered {} items from truncated JSON", items.size());
|
||||||
@@ -179,4 +178,27 @@ public class OciGenAiService {
|
|||||||
|
|
||||||
throw new RuntimeException("JSON parse failed: " + raw.substring(0, Math.min(80, raw.length())));
|
throw new RuntimeException("JSON parse failed: " + raw.substring(0, Math.min(80, raw.length())));
|
||||||
}
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #326 — JSON 객체 시작 위치(`{`)에서 매칭되는 닫는 `}` 인덱스를 반환.
|
||||||
|
* 문자열 안의 `{` `}`와 escape는 무시. 매칭 못 찾으면 -1.
|
||||||
|
*/
|
||||||
|
private static int findObjectEnd(String raw, int start) {
|
||||||
|
int depth = 0;
|
||||||
|
boolean inString = false;
|
||||||
|
boolean escaped = false;
|
||||||
|
for (int i = start; i < raw.length(); i++) {
|
||||||
|
char c = raw.charAt(i);
|
||||||
|
if (escaped) { escaped = false; continue; }
|
||||||
|
if (c == '\\') { escaped = true; continue; }
|
||||||
|
if (c == '"') { inString = !inString; continue; }
|
||||||
|
if (inString) continue;
|
||||||
|
if (c == '{') depth++;
|
||||||
|
else if (c == '}') {
|
||||||
|
depth--;
|
||||||
|
if (depth == 0) return i;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return -1;
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|||||||
@@ -0,0 +1,51 @@
|
|||||||
|
package com.tasteby.service;
|
||||||
|
|
||||||
|
import org.slf4j.Logger;
|
||||||
|
import org.slf4j.LoggerFactory;
|
||||||
|
import org.springframework.beans.factory.annotation.Value;
|
||||||
|
import org.springframework.data.redis.core.StringRedisTemplate;
|
||||||
|
import org.springframework.stereotype.Service;
|
||||||
|
|
||||||
|
import java.time.Duration;
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #337 — IP 기반 레이트리밋 (방문 카운트 어뷰즈 차단).
|
||||||
|
*
|
||||||
|
* 단순 Redis SETIFABSENT(SET NX EX) 패턴:
|
||||||
|
* - 첫 호출 시 키 등록 + TTL → 허용
|
||||||
|
* - TTL 동안 다음 호출은 키 존재로 차단
|
||||||
|
*
|
||||||
|
* Redis 다운 시 fail-open (true 반환) — 사용자 페이지 로드 우선.
|
||||||
|
* 멀티 파드 + Redis 단일 인스턴스 환경에서 자연스럽게 동작.
|
||||||
|
*/
|
||||||
|
@Service
|
||||||
|
public class RateLimitService {
|
||||||
|
|
||||||
|
private static final Logger log = LoggerFactory.getLogger(RateLimitService.class);
|
||||||
|
private static final String PREFIX = "ratelimit:visit:";
|
||||||
|
|
||||||
|
private final StringRedisTemplate redis;
|
||||||
|
|
||||||
|
@Value("${app.rate-limit.visit-window-seconds:60}")
|
||||||
|
private long visitWindowSeconds;
|
||||||
|
|
||||||
|
public RateLimitService(StringRedisTemplate redis) {
|
||||||
|
this.redis = redis;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* 단일 IP의 visit 호출 허용 여부.
|
||||||
|
* @return true = 허용 (첫 호출 또는 윈도우 만료), false = 차단 (윈도우 안 재호출)
|
||||||
|
*/
|
||||||
|
public boolean tryConsume(String ipKey) {
|
||||||
|
try {
|
||||||
|
String key = PREFIX + ipKey;
|
||||||
|
Boolean ok = redis.opsForValue().setIfAbsent(key, "1", Duration.ofSeconds(visitWindowSeconds));
|
||||||
|
return Boolean.TRUE.equals(ok);
|
||||||
|
} catch (Exception e) {
|
||||||
|
// fail-open: Redis 문제로 통계가 약간 부풀어도 사용자 영향 X
|
||||||
|
log.debug("RateLimit error (fail-open): {}", e.getMessage());
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
@@ -38,11 +38,13 @@ public class ReviewService {
|
|||||||
return mapper.findById(id);
|
return mapper.findById(id);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@Transactional // #334 — 단일 SQL이지만 어노테이션 일관성
|
||||||
public boolean update(String reviewId, String userId, Double rating, String reviewText, LocalDate visitedAt) {
|
public boolean update(String reviewId, String userId, Double rating, String reviewText, LocalDate visitedAt) {
|
||||||
String visitedStr = visitedAt != null ? visitedAt.toString() : null;
|
String visitedStr = visitedAt != null ? visitedAt.toString() : null;
|
||||||
return mapper.updateReview(reviewId, userId, rating, reviewText, visitedStr) > 0;
|
return mapper.updateReview(reviewId, userId, rating, reviewText, visitedStr) > 0;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@Transactional // #334 — 단일 SQL이지만 어노테이션 일관성
|
||||||
public boolean delete(String reviewId, String userId) {
|
public boolean delete(String reviewId, String userId) {
|
||||||
return mapper.deleteReview(reviewId, userId) > 0;
|
return mapper.deleteReview(reviewId, userId) > 0;
|
||||||
}
|
}
|
||||||
|
|||||||
25
backend-java/src/main/java/com/tasteby/util/BotDetector.java
Normal file
25
backend-java/src/main/java/com/tasteby/util/BotDetector.java
Normal file
@@ -0,0 +1,25 @@
|
|||||||
|
package com.tasteby.util;
|
||||||
|
|
||||||
|
import java.util.regex.Pattern;
|
||||||
|
|
||||||
|
/**
|
||||||
|
* #337 — User-Agent 기반 봇 패턴 매칭.
|
||||||
|
*
|
||||||
|
* Googlebot / bingbot / facebookexternalhit / 일반 crawler/spider 등을 일괄 차단.
|
||||||
|
* 빈 UA는 봇으로 간주하지 않음(모바일 앱 등 정상 케이스 보호).
|
||||||
|
*/
|
||||||
|
public final class BotDetector {
|
||||||
|
|
||||||
|
private BotDetector() {}
|
||||||
|
|
||||||
|
// 일반적인 봇/크롤러 패턴. 케이스 무시.
|
||||||
|
private static final Pattern BOT_PATTERN = Pattern.compile(
|
||||||
|
"bot|crawler|spider|slurp|scrap|fetch|monitor|preview|lighthouse",
|
||||||
|
Pattern.CASE_INSENSITIVE
|
||||||
|
);
|
||||||
|
|
||||||
|
public static boolean isBot(String userAgent) {
|
||||||
|
if (userAgent == null || userAgent.isBlank()) return false;
|
||||||
|
return BOT_PATTERN.matcher(userAgent).find();
|
||||||
|
}
|
||||||
|
}
|
||||||
@@ -64,6 +64,10 @@ app:
|
|||||||
# 0.57은 cohere embed-v4 한국어 시맨틱 적합도 기준 경험값.
|
# 0.57은 cohere embed-v4 한국어 시맨틱 적합도 기준 경험값.
|
||||||
max-distance: ${SEARCH_MAX_DISTANCE:0.57}
|
max-distance: ${SEARCH_MAX_DISTANCE:0.57}
|
||||||
|
|
||||||
|
rate-limit:
|
||||||
|
# #337 — 같은 IP에서 visit 카운트 허용 간격(초). 기본 60.
|
||||||
|
visit-window-seconds: ${VISIT_WINDOW_SECONDS:60}
|
||||||
|
|
||||||
build:
|
build:
|
||||||
# #338 — 배포 시 deploy.sh가 env로 주입. dev에서는 dev/unknown.
|
# #338 — 배포 시 deploy.sh가 env로 주입. dev에서는 dev/unknown.
|
||||||
version: ${APP_VERSION:dev}
|
version: ${APP_VERSION:dev}
|
||||||
|
|||||||
81
docs/design/326-parsejson-optimization/README.md
Normal file
81
docs/design/326-parsejson-optimization/README.md
Normal file
@@ -0,0 +1,81 @@
|
|||||||
|
# 설계서: OciGenAiService.parseJson 단일 패스 최적화 (#326)
|
||||||
|
|
||||||
|
> **상태**: Approved
|
||||||
|
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
|
||||||
|
> **추적성** — Redmine: #326 · 부모: #292 (추출 파이프라인 Reviewer 후속, 09-Done)
|
||||||
|
> · 구현 파일: `backend-java/src/main/java/com/tasteby/service/OciGenAiService.java`
|
||||||
|
|
||||||
|
## 1. 목적 (Why)
|
||||||
|
|
||||||
|
LLM 응답이 잘린(truncated) 배열일 때 `parseJson`의 복구 로직이 O(N²): 각 객체 시작점에서 `end`를 1씩 늘려가며 매번 `mapper.readValue(substring)`을 try. 8192 토큰 응답(약 30KB)에서 매우 비효율 + 매 try마다 Jackson 예외 객체 생성(스택트레이스 양산). brace depth counter로 단일 패스 O(N)으로 교체.
|
||||||
|
|
||||||
|
## 2. 범위
|
||||||
|
|
||||||
|
- **포함**: `parseJson`의 truncated-array 복구 로직을 brace depth counter로 변경.
|
||||||
|
- **제외**: `parseJson`의 마크다운/콤마 정규식 전처리는 그대로. Jackson streaming API 도입은 추가 최적화이지만 본 범위 밖.
|
||||||
|
|
||||||
|
## 3. 인수조건
|
||||||
|
|
||||||
|
- [ ] 정상 JSON 배열 → 동일 결과 반환.
|
||||||
|
- [ ] 잘린 배열(끝 `}` 누락) → 가능한 만큼 객체 추출 + 로그.
|
||||||
|
- [ ] 문자열 안의 `{` `}` `"` (escape 포함) 잘못 카운트 안 됨.
|
||||||
|
- [ ] 8192 token 응답 처리 시간 < 10ms (이전: 수백 ms 가능).
|
||||||
|
- [ ] 회귀 없음 (기존 추출 파이프라인 시나리오 통과).
|
||||||
|
|
||||||
|
## 4. 컨텍스트 & 제약
|
||||||
|
|
||||||
|
- LLM 응답은 마크다운 + JSON 혼합 가능.
|
||||||
|
- 응답 크기 최대 약 30KB (8192 token × 4 char/token).
|
||||||
|
- mapper는 Jackson ObjectMapper.
|
||||||
|
|
||||||
|
## 5. 아키텍처 개요
|
||||||
|
|
||||||
|
```
|
||||||
|
parseJson(raw)
|
||||||
|
├ strip markdown/trailing commas (기존)
|
||||||
|
├ try readValue(raw) → 성공 시 반환
|
||||||
|
└ truncated array 복구:
|
||||||
|
idx = '['의 다음
|
||||||
|
while idx < len:
|
||||||
|
skip whitespace, ','
|
||||||
|
if raw[idx] != '{': break // 객체 아님
|
||||||
|
depth=0, inString=false, escaped=false
|
||||||
|
단일 패스로 객체 끝 (depth==0 && } 만남) 찾음
|
||||||
|
items.add(readValue(substring))
|
||||||
|
idx = 객체 끝 다음
|
||||||
|
return items
|
||||||
|
```
|
||||||
|
|
||||||
|
## 6. 함수 명세
|
||||||
|
|
||||||
|
| 함수 | 책임 | 비고 |
|
||||||
|
|------|------|------|
|
||||||
|
| `parseJson(raw)` (수정) | brace depth + 단일 readValue | private 헬퍼 `findObjectEnd(raw, start)` 추출 |
|
||||||
|
|
||||||
|
## 7. 흐름
|
||||||
|
|
||||||
|
1. 기존 정규식 전처리.
|
||||||
|
2. 전체 파싱 시도.
|
||||||
|
3. 실패 + 배열 시작이면 위 알고리즘으로 객체 단위 복구.
|
||||||
|
|
||||||
|
## 8. 엣지케이스
|
||||||
|
|
||||||
|
- **빈 배열 `[]`**: 일반 readValue가 처리.
|
||||||
|
- **문자열 안 `{` `}`**: inString 토글로 무시.
|
||||||
|
- **escape `\"` `\\`**: escaped 토글로 무시.
|
||||||
|
- **객체가 아닌 원시값 배열 `[1, 2, 3]`**: 첫 char가 `{`가 아니므로 break. 전체 파싱이 성공할 경우 도달 안 함.
|
||||||
|
- **매우 짧은 응답**: 전체 파싱이 성공 → 복구 경로 미진입.
|
||||||
|
|
||||||
|
## 9. 테스트
|
||||||
|
|
||||||
|
- 정상 배열, 잘린 끝, 마크다운 wrap, escape 포함 5케이스 unit test (후속).
|
||||||
|
|
||||||
|
## 10. 리스크 & 대안
|
||||||
|
|
||||||
|
- **선택**: brace depth counter (단일 패스).
|
||||||
|
- **대안 A**: Jackson `JsonParser` streaming API — 더 빠르지만 코드 복잡.
|
||||||
|
- **대안 B**: 응답을 모두 받지 않고 streaming 파싱 — 본 범위 밖.
|
||||||
|
|
||||||
|
## 11. 미해결 질문
|
||||||
|
|
||||||
|
- LLM 응답에 객체 외 다른 타입 섞일 수 있는가? 현재 추출 결과는 `[{...}, {...}]` 형태로 가정.
|
||||||
81
docs/design/331-vector-batch-insert/README.md
Normal file
81
docs/design/331-vector-batch-insert/README.md
Normal file
@@ -0,0 +1,81 @@
|
|||||||
|
# 설계서: VectorService batch insert + IdGenerator 공통화 (#331)
|
||||||
|
|
||||||
|
> **상태**: Approved
|
||||||
|
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
|
||||||
|
> **추적성** — Redmine: #331 · 부모: #293 (검색/벡터 Reviewer 후속, 09-Done)
|
||||||
|
> · 구현 파일: `backend-java/src/main/java/com/tasteby/service/VectorService.java`
|
||||||
|
> · 테스트: 본 이슈 범위 밖 (단위 테스트 인프라 도입은 #343 후속 묶음에 해당)
|
||||||
|
|
||||||
|
## 1. 목적 (Why)
|
||||||
|
|
||||||
|
`VectorService.saveRestaurantVectors`가 chunk N개를 N번의 단건 `jdbc.update`로 처리한다. 현재 `buildChunks`가 1개 청크만 반환해 N=1이지만, 향후 chunk 분할 도입 시 N+1 INSERT 비효율. 또한 UUID 생성 코드가 인라인 변환(`UUID.randomUUID().toString().replace("-", "").substring(0, 32).toUpperCase()`)으로 다른 곳의 `IdGenerator.newId()`와 중복.
|
||||||
|
|
||||||
|
## 2. 범위
|
||||||
|
|
||||||
|
- **포함**
|
||||||
|
- `jdbc.batchUpdate(sql, SqlParameterSource[])`로 단일 호출 전환.
|
||||||
|
- UUID 생성을 `IdGenerator.newId()` 공통 유틸로 교체.
|
||||||
|
- **제외**
|
||||||
|
- 단위/통합 테스트 도입 (테스트 인프라 미도입 — 별도 후속 #343 묶음).
|
||||||
|
- `buildChunks`의 chunk 분할 로직 자체 변경 (현재 단일 청크 정책 유지).
|
||||||
|
- `restaurant_vectors` 스키마 변경.
|
||||||
|
|
||||||
|
## 3. 인수조건
|
||||||
|
|
||||||
|
- [ ] `saveRestaurantVectors`가 한 번의 `jdbc.batchUpdate` 호출로 N개 청크 삽입.
|
||||||
|
- [ ] UUID 인라인 변환 제거 → `IdGenerator.newId()` 호출.
|
||||||
|
- [ ] 회귀 없음 — 신규 식당 등록 시 `restaurant_vectors`에 정상 row 추가.
|
||||||
|
- [ ] N=0 가드(`chunks.isEmpty()`)는 유지.
|
||||||
|
|
||||||
|
## 4. 컨텍스트 & 제약
|
||||||
|
|
||||||
|
- Spring `NamedParameterJdbcTemplate.batchUpdate(String, SqlParameterSource[])` 사용.
|
||||||
|
- Oracle VECTOR 타입 파라미터는 `float[]`로 그대로 바인딩 가능 (`MapSqlParameterSource.addValue`).
|
||||||
|
- 한 batch 안 `int[]` 반환 → batch 결과 카운트는 사용하지 않음(throw if 어쩌고 미적용).
|
||||||
|
- `IdGenerator.newId()` 시그니처: `public static String newId()` → 32-char uppercase hex (현재 인라인과 동일).
|
||||||
|
|
||||||
|
## 5. 아키텍처 개요
|
||||||
|
|
||||||
|
```
|
||||||
|
saveRestaurantVectors(restaurantId, chunks)
|
||||||
|
├ if chunks.isEmpty() → return
|
||||||
|
├ embeddings = genAi.embedTexts(chunks)
|
||||||
|
├ params[] = build N개 MapSqlParameterSource
|
||||||
|
│ .addValue("id", IdGenerator.newId())
|
||||||
|
│ .addValue("rid", restaurantId)
|
||||||
|
│ .addValue("chunk", chunks.get(i))
|
||||||
|
│ .addValue("emb", float[] embeddings[i])
|
||||||
|
└ jdbc.batchUpdate(sql, params)
|
||||||
|
```
|
||||||
|
|
||||||
|
## 6. 함수 명세
|
||||||
|
|
||||||
|
| 함수 | 책임 | 비고 |
|
||||||
|
|------|------|------|
|
||||||
|
| `VectorService.saveRestaurantVectors(id, chunks)` (수정) | batchUpdate 1회 | IdGenerator 사용 |
|
||||||
|
|
||||||
|
## 7. 흐름
|
||||||
|
|
||||||
|
1. embed 호출 (기존).
|
||||||
|
2. `SqlParameterSource[]` 생성.
|
||||||
|
3. `jdbc.batchUpdate(sql, params)` 단일 호출.
|
||||||
|
|
||||||
|
## 8. 엣지케이스
|
||||||
|
|
||||||
|
- **chunks 빈 배열**: 조기 return (기존 유지).
|
||||||
|
- **embed 결과와 chunks 크기 불일치**: 현재 OCI GenAI는 입력 N → 출력 N 보장. 안전 가드 추가는 본 범위 밖 (필요 시 후속).
|
||||||
|
|
||||||
|
## 9. 테스트 (수동만)
|
||||||
|
|
||||||
|
- dev에서 신규 식당 등록(데몬 또는 수동 trigger) → `SELECT count(*) FROM restaurant_vectors WHERE restaurant_id = '...'` 정상 row 확인.
|
||||||
|
|
||||||
|
## 10. 리스크 & 대안
|
||||||
|
|
||||||
|
- **선택**: `NamedParameterJdbcTemplate.batchUpdate`. 단일 트랜잭션 + 단일 round-trip.
|
||||||
|
- **대안 A**: `JdbcTemplate.batchUpdate(BatchPreparedStatementSetter)` — 더 저수준이지만 named param 손실.
|
||||||
|
- **대안 B**: MERGE로 upsert — 동일 restaurant_id 재처리 시 중복 제거 가능. 다만 본 이슈 범위 밖.
|
||||||
|
|
||||||
|
## 11. 미해결 질문
|
||||||
|
|
||||||
|
- chunk 분할 정책(현재 1개 단일 청크) — 후속 (검색 정확도 vs 토큰 비용 트레이드오프 결정).
|
||||||
|
- batchUpdate 결과 row 수 검증 — 운영 모니터링 도구 도입 후 결정.
|
||||||
94
docs/design/332-restaurant-update-whitelist/README.md
Normal file
94
docs/design/332-restaurant-update-whitelist/README.md
Normal file
@@ -0,0 +1,94 @@
|
|||||||
|
# 설계서: Restaurant 임의 필드 업데이트 화이트리스트 (#332)
|
||||||
|
|
||||||
|
> **상태**: Approved
|
||||||
|
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
|
||||||
|
> **추적성** — Redmine: #332 · 부모: #290 (식당 CRUD Reviewer 후속, 09-Done)
|
||||||
|
> · 구현 파일: `backend-java/src/main/java/com/tasteby/controller/RestaurantController.java`, `backend-java/src/main/java/com/tasteby/service/RestaurantService.java`
|
||||||
|
> · 테스트: 수동 (curl로 화이트리스트 외 필드 시도)
|
||||||
|
|
||||||
|
## 1. 목적 (Why)
|
||||||
|
|
||||||
|
`PUT /api/restaurants/{id}` body가 `Map<String, Object>`로 임의 키를 받는다. SQL 측 `updateFields`는 컬럼별 `<if test="containsKey('...')">` 가드로 화이트리스트가 이미 적용되어 있어 임의 컬럼 갱신은 차단된다. 다만 Controller 레벨에서 화이트리스트가 명시되지 않아 — (a) 의도 모호, (b) 향후 SQL 측 가드가 무력화되거나 다른 매퍼로 확장되면 위험. 명시적 화이트리스트로 의도 강화.
|
||||||
|
|
||||||
|
## 2. 범위 (Scope)
|
||||||
|
|
||||||
|
- **포함**
|
||||||
|
- `RestaurantController.update(id, body)`에서 허용된 키만 통과시키는 `ALLOWED_UPDATE_FIELDS` set.
|
||||||
|
- 허용되지 않은 키는 무시(silently drop) + 디버그 로그. 400 응답은 hard policy라 사용자 경험 영향 큼.
|
||||||
|
- **제외 (out of scope)**
|
||||||
|
- DTO 클래스 도입 (RestaurantUpdateDTO + Bean Validation) — 더 강한 표준화지만 코드 영향 큼. 후속.
|
||||||
|
- DDG HTML 검색 → 정식 API 전환 (별도 후속, 비용/계약 결정 필요).
|
||||||
|
- isNameSimilar 한국어 자모 알고리즘 (별도 후속).
|
||||||
|
- UNIQUE(google_place_id) 제약 강화 (DB 마이그레이션 + 데이터 정리 필요, 별도).
|
||||||
|
|
||||||
|
## 3. 인수조건
|
||||||
|
|
||||||
|
- [ ] `ALLOWED_UPDATE_FIELDS` 상수 정의 (SQL `updateFields` 가드와 일치).
|
||||||
|
- [ ] PUT 호출 시 body에서 허용 외 키는 자동 제거 + 디버그 로그.
|
||||||
|
- [ ] 허용 키만 있는 정상 호출 → 200 정상 동작 회귀 없음.
|
||||||
|
- [ ] 허용 외 키만 있는 호출 → 200 + 변경 없음 (또는 200 + 빈 업데이트).
|
||||||
|
|
||||||
|
## 4. 컨텍스트 & 제약
|
||||||
|
|
||||||
|
- Spring MVC. 변경 최소화. DTO 도입 없이도 가드 가능.
|
||||||
|
- 운영 영향 없음 (어드민이 화면에서 호출하는 키는 모두 허용 set 안에).
|
||||||
|
- 가정: 화이트리스트 set은 SQL `updateFields` 의 `<if>` 키들과 1:1.
|
||||||
|
|
||||||
|
## 5. 아키텍처 개요
|
||||||
|
|
||||||
|
```
|
||||||
|
PUT /api/restaurants/{id} body
|
||||||
|
│
|
||||||
|
▼
|
||||||
|
RestaurantController.update
|
||||||
|
├ requireAdmin
|
||||||
|
├ allowed = ALLOWED_UPDATE_FIELDS
|
||||||
|
├ filtered = body where key ∈ allowed
|
||||||
|
├ if (filtered.isEmpty()) → 200 + no-op
|
||||||
|
└ restaurantService.update(id, filtered) → mapper.updateFields
|
||||||
|
```
|
||||||
|
|
||||||
|
## 6. 데이터 모델
|
||||||
|
|
||||||
|
`Set<String> ALLOWED_UPDATE_FIELDS = Set.of(name, address, region, cuisine_type, price_range, phone, website, tabling_url, catchtable_url, latitude, longitude, google_place_id, business_status, rating, rating_count)` — SQL `updateFields`의 키들과 일치.
|
||||||
|
|
||||||
|
## 7. 함수 명세
|
||||||
|
|
||||||
|
| 함수 | 책임 | 비고 |
|
||||||
|
|------|------|------|
|
||||||
|
| `RestaurantController.update(id, body)` (수정) | 화이트리스트 필터 후 위임 | filtered.isEmpty()면 no-op |
|
||||||
|
|
||||||
|
## 8. 흐름
|
||||||
|
|
||||||
|
1. body Map 수신.
|
||||||
|
2. `body.entrySet().stream().filter(e -> ALLOWED_UPDATE_FIELDS.contains(e.getKey())).collect(toMap)`.
|
||||||
|
3. 비어있으면 200 응답하고 끝.
|
||||||
|
4. 아니면 `restaurantService.update(id, filtered)` 호출.
|
||||||
|
|
||||||
|
## 9. 엣지케이스
|
||||||
|
|
||||||
|
- **빈 body**: 200 + no-op.
|
||||||
|
- **허용 외 키만**: 200 + no-op + 디버그 로그.
|
||||||
|
- **null 값을 포함한 허용 키**: SQL `updateFields`가 그대로 NULL 저장 — 의도된 동작 (좌표/주소 해제 등).
|
||||||
|
|
||||||
|
## 10. 테스트
|
||||||
|
|
||||||
|
- 수동:
|
||||||
|
```
|
||||||
|
curl -X PUT -H "Authorization: Bearer <admin>" -H "Content-Type: application/json" \
|
||||||
|
-d '{"name":"테스트", "is_admin":true}' /api/restaurants/<id>
|
||||||
|
→ name만 갱신, is_admin은 무시
|
||||||
|
```
|
||||||
|
- 자동: 별도 후속(통합 테스트 인프라 도입 시).
|
||||||
|
|
||||||
|
## 11. 리스크 & 대안
|
||||||
|
|
||||||
|
- **선택**: Controller 화이트리스트 set + silent drop.
|
||||||
|
- **대안 A**: DTO + Bean Validation — 표준화 깔끔하지만 변경 범위 큼.
|
||||||
|
- **대안 B**: 허용 외 키 발견 시 400 — 사용자 경험 부담, 클라이언트가 잘못된 키 보내면 즉시 실패. 본 변경은 보수적으로 silent drop.
|
||||||
|
|
||||||
|
## 12. 미해결 질문
|
||||||
|
|
||||||
|
- DDG → 정식 검색 API 전환 — 별도 후속 (비용/계약 결정).
|
||||||
|
- isNameSimilar 한국어 알고리즘 — 별도 후속.
|
||||||
|
- DTO 도입 표준화 — 별도 후속.
|
||||||
104
docs/design/335-daemon-distributed-lock/README.md
Normal file
104
docs/design/335-daemon-distributed-lock/README.md
Normal file
@@ -0,0 +1,104 @@
|
|||||||
|
# 설계서: 데몬 스케줄러 분산 락 (#335)
|
||||||
|
|
||||||
|
> **상태**: Approved
|
||||||
|
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
|
||||||
|
> **추적성** — Redmine: #335 · 부모: #275 (현행화 backend-daemon, 09-Done)
|
||||||
|
> · 구현 파일: `backend-java/build.gradle`, `backend-java/src/main/java/com/tasteby/TastebyApplication.java`, `backend-java/src/main/java/com/tasteby/config/ShedLockConfig.java` (신규), `backend-java/src/main/java/com/tasteby/service/DaemonScheduler.java`
|
||||||
|
> · 테스트: 수동 (롤링 업데이트 시 두 파드 공존 시뮬레이션)
|
||||||
|
|
||||||
|
## 1. 목적 (Why)
|
||||||
|
|
||||||
|
OKE 운영에서 backend Pod 1개로 동작하지만 RollingUpdate(maxSurge>0) 시 신·구 Pod이 잠시 공존. 또한 dev(PM2)와 운영이 같은 Oracle ATP를 공유 — 이미 `DAEMON_ENABLED` 플래그로 dev 폴링은 차단했지만, 운영 자체에서 두 Pod이 같은 30초 주기로 `scanAllChannels`를 호출하면 YouTube/OCI GenAI 중복 호출 + 동일 영상 두 번 처리 + 봇 감지 위험. ShedLock으로 한 인스턴스만 실행하도록 보장.
|
||||||
|
|
||||||
|
## 2. 범위 (Scope)
|
||||||
|
|
||||||
|
- **포함**
|
||||||
|
- `DaemonScheduler.run()`을 분산 락으로 보호 (lockAtMostFor + lockAtLeastFor).
|
||||||
|
- Lock provider: Redis (이미 운영 중인 in-cluster Redis 재사용).
|
||||||
|
- 의존성: `net.javacrumbs.shedlock:shedlock-spring`, `shedlock-provider-redis-spring`.
|
||||||
|
- **제외 (out of scope)**
|
||||||
|
- 다른 @Scheduled 메서드(CacheService.checkHealth, 향후 추가될 cron). 필요 시 같은 패턴으로 확장.
|
||||||
|
- 락 획득 실패 시 알람 — Spring Actuator/Micrometer 도입 후 후속.
|
||||||
|
- DB 기반 lock provider (JDBC) — Redis가 충분.
|
||||||
|
|
||||||
|
## 3. 인수조건
|
||||||
|
|
||||||
|
- [ ] build.gradle에 shedlock-spring + shedlock-provider-redis-spring 추가.
|
||||||
|
- [ ] `@EnableSchedulerLock` 활성화.
|
||||||
|
- [ ] `DaemonScheduler.run`에 `@SchedulerLock(name="daemon-runner", ...)` 적용.
|
||||||
|
- [ ] 락 키는 `lock:daemon-runner` 형태로 Redis에 저장 (prefix 기본).
|
||||||
|
- [ ] 운영 배포 후 로그에 lock acquire/release 메시지 또는 정상 동작 확인.
|
||||||
|
- [ ] 회귀 없음 — 자동 cron 정상 동작.
|
||||||
|
|
||||||
|
## 4. 컨텍스트 & 제약
|
||||||
|
|
||||||
|
- Redis는 in-cluster 단일 인스턴스. ShedLock의 Redis provider는 단일 인스턴스에서 SET NX EX로 동작.
|
||||||
|
- Pod 1개 운영이라 평소엔 락 경합 없음 → ShedLock 부하 미미 (Redis 1회 SET NX EX, <1ms).
|
||||||
|
- `lockAtMostFor`: 락이 강제로 해제되기까지 시간. `scanAllChannels`는 channel 6 × 영상 fetch 시간 ≈ 최대 10분 예상. `PT15M`로 안전 마진.
|
||||||
|
- `lockAtLeastFor`: 작업이 빨리 끝나도 락 유지하는 최소 시간 (다음 cron이 즉시 잡지 못하게). 30초 cycle이라 PT30S로 충분.
|
||||||
|
|
||||||
|
## 5. 아키텍처 개요
|
||||||
|
|
||||||
|
```
|
||||||
|
[Pod A] [Pod B]
|
||||||
|
│ │
|
||||||
|
│ @Scheduled(fixedDelay=30s)
|
||||||
|
▼ ▼
|
||||||
|
DaemonScheduler.run DaemonScheduler.run
|
||||||
|
│ │
|
||||||
|
│ @SchedulerLock │ @SchedulerLock
|
||||||
|
▼ ▼
|
||||||
|
LockProvider (Redis)
|
||||||
|
├─ SET lock:daemon-runner EX 900 NX ✓ → Pod A 진행
|
||||||
|
└─ SET lock:daemon-runner EX 900 NX ✗ → Pod B 즉시 종료(no-op)
|
||||||
|
│
|
||||||
|
▼
|
||||||
|
scanAllChannels / processPending 실행 (A만)
|
||||||
|
│
|
||||||
|
▼ 종료 시 락 키 lockUntil 시각으로 갱신 (lockAtLeastFor 보장)
|
||||||
|
```
|
||||||
|
|
||||||
|
## 6. 데이터 모델
|
||||||
|
|
||||||
|
Redis 키 1개:
|
||||||
|
- key: `lock:daemon-runner`
|
||||||
|
- value: lockedBy(host:pid) + lockedAt
|
||||||
|
- expiry: lockAtMostFor
|
||||||
|
|
||||||
|
## 7. 함수 명세
|
||||||
|
|
||||||
|
| 함수 | 책임 | 시그니처 | 비고 |
|
||||||
|
|------|------|----------|------|
|
||||||
|
| `DaemonScheduler.run()` (수정) | @SchedulerLock 추가 | 기존 | name="daemon-runner" |
|
||||||
|
| `ShedLockConfig.lockProvider(...)` (신규) | Bean 등록 | `LockProvider lockProvider(RedisConnectionFactory)` | Redis provider |
|
||||||
|
|
||||||
|
## 8. 흐름
|
||||||
|
|
||||||
|
1. 30초마다 fixedDelay로 run() 호출.
|
||||||
|
2. ShedLock AOP가 SET NX EX 시도.
|
||||||
|
3. 성공: 본문 실행. 실패: 즉시 반환(no-op).
|
||||||
|
4. 본문 종료 시 lockUntil 갱신.
|
||||||
|
|
||||||
|
## 9. 엣지케이스
|
||||||
|
|
||||||
|
- **lockAtMostFor 초과 작업**: 락 자동 해제 후 다른 Pod이 잡을 수 있음. scanAllChannels가 15분 넘기지 않게 channel별 timeout 적용 권고(설계서 #275 §11 참고).
|
||||||
|
- **Pod 죽음**: lockAtMostFor 만료 후 자동 해제.
|
||||||
|
- **Redis 다운**: SET 실패 → Spring AOP가 RuntimeException → 다음 30초에 재시도. 캐시 disabled와 별개.
|
||||||
|
- **clock skew**: ShedLock은 Redis 서버 시간 기준이라 클러스터 노드 간 시간 차이 무관.
|
||||||
|
|
||||||
|
## 10. 테스트 계획
|
||||||
|
|
||||||
|
- 수동: Pod 2개 동시 실행 (kubectl scale deploy backend --replicas=2) 후 로그에서 한 쪽만 `Running scheduled channel scan...` 찍히는지 확인.
|
||||||
|
- 자동: 후속 (ShedLock 자체는 lib 차원에서 테스트됨).
|
||||||
|
|
||||||
|
## 11. 리스크 & 대안
|
||||||
|
|
||||||
|
- **선택**: ShedLock + Redis.
|
||||||
|
- **대안 A**: Redis SET NX EX 수동 구현 — 가능하나 ShedLock이 lockAtMostFor/lockAtLeastFor 자동 처리해서 더 안전.
|
||||||
|
- **대안 B**: DB(Oracle) 기반 ShedLock — 추가 테이블 필요 + DB 부하. Redis가 더 단순.
|
||||||
|
- **대안 C**: 단일 leader pod (k8s Lease object) — Spring Cloud Kubernetes 도입 부담 크다.
|
||||||
|
|
||||||
|
## 12. 미해결 질문
|
||||||
|
|
||||||
|
- ShedLock 의존성이 standard library가 아닌 4th-party에 가까움 — 검증된 라이브러리(8년+ 사용, 4k+ stars)지만 향후 Spring 마이크로 버전 호환성은 별도 모니터링.
|
||||||
|
- CacheService.checkHealth는 락 안 걸어도 됨(idempotent). 추가 cron 도입 시 same name 충돌 주의.
|
||||||
162
docs/design/336-cache-scan-recovery/README.md
Normal file
162
docs/design/336-cache-scan-recovery/README.md
Normal file
@@ -0,0 +1,162 @@
|
|||||||
|
# 설계서: 캐시 SCAN/UNLINK + disabled 자동 복구 + 에러 메트릭 (#336)
|
||||||
|
|
||||||
|
> **상태**: Approved <!-- Draft | Approved | Superseded -->
|
||||||
|
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
|
||||||
|
> **추적성** — Redmine: #336 · 부모: #276 (현행화 backend-cache, 09-Done)
|
||||||
|
> · 구현 파일: `backend-java/src/main/java/com/tasteby/service/CacheService.java`, `backend-java/src/main/java/com/tasteby/controller/AdminCacheController.java`
|
||||||
|
> · 테스트: 후속 (Testcontainers Redis 인프라는 별도)
|
||||||
|
|
||||||
|
## 1. 목적 (Why)
|
||||||
|
|
||||||
|
`CacheService.flush()`가 `redis.keys("tasteby:*")` 블로킹 명령을 사용해 키가 많아지면 Redis 인스턴스 전체가 정지(Redis는 single-threaded). 또한 생성자에서 한 번 ping 실패하면 `disabled=true`로 영구 no-op 상태 — Redis가 재기동되어도 자동 복구 안 됨. 그리고 set/get/flush 실패가 DEBUG 로그로만 묻혀 운영 monitoring 사각지대.
|
||||||
|
|
||||||
|
## 2. 범위 (Scope)
|
||||||
|
|
||||||
|
- **포함**
|
||||||
|
- `flush()`/추후 `flushByPrefix()`를 `SCAN` + `UNLINK`(논블로킹 삭제)로 교체.
|
||||||
|
- 30초 주기 헬스체크로 `disabled` 플래그 자동 토글 (Redis 재기동 시 자동 복구).
|
||||||
|
- 캐시 에러 카운터(in-memory `AtomicLong`)와 마지막 에러 메시지를 노출하는 admin 엔드포인트.
|
||||||
|
- **제외 (out of scope)**
|
||||||
|
- Micrometer/Prometheus 메트릭 stack 도입(별도 이슈, Spring Boot Actuator + 별도 인프라).
|
||||||
|
- Testcontainers Redis 기반 단위 테스트(별도 후속, 인프라 도입 비용 큼).
|
||||||
|
- 캐시 key 네임스페이스 다중화.
|
||||||
|
|
||||||
|
## 3. 인수조건 (Acceptance Criteria)
|
||||||
|
|
||||||
|
- [ ] `flush()`가 `KEYS` 대신 SCAN 커서 기반으로 동작한다 (블로킹 없음).
|
||||||
|
- [ ] 삭제는 `UNLINK`(Redis 4.0+ 논블로킹) 사용. 미지원 환경에서는 `DEL`로 폴백.
|
||||||
|
- [ ] Redis가 다운된 상태에서 startup → `disabled=true`. 이후 Redis 재기동되면 60초 이내 `disabled=false`로 자동 복구되어 set/get 정상 동작한다.
|
||||||
|
- [ ] set/get/flush/del의 예외는 `cacheErrorCount` 카운터가 증가하고 `lastError`에 메시지를 기록한다.
|
||||||
|
- [ ] `GET /api/admin/cache/stats` 가 `{ disabled, errorCount, lastError }` 응답.
|
||||||
|
- [ ] 기존 캐시 동작(hit/miss/TTL) 회귀 없음.
|
||||||
|
- [ ] 운영 배포 후 외부 `/api/restaurants` 응답이 캐시 hit 경로에서 변함없이 동작.
|
||||||
|
|
||||||
|
## 4. 컨텍스트 & 제약
|
||||||
|
|
||||||
|
- Spring Data Redis 3.x + Lettuce 클라이언트.
|
||||||
|
- 운영 Redis: OKE in-cluster (단일 인스턴스, persistence X). UNLINK 지원.
|
||||||
|
- 키 prefix: `tasteby:`. 현재 키 개수는 수십~수백 (식당/검색/채널 캐시), 향후 수만으로 증가 가능성.
|
||||||
|
- 30초 헬스체크 추가 부하 미미(ping 한 번 = 0.5ms 이하).
|
||||||
|
- 가정: `StringRedisTemplate.execute(RedisCallback)`에서 native `ScanOptions` + `RedisServerCommands.scan()` 사용 가능.
|
||||||
|
|
||||||
|
## 5. 아키텍처 개요
|
||||||
|
|
||||||
|
```
|
||||||
|
[ Spring Context ]
|
||||||
|
│
|
||||||
|
▼
|
||||||
|
CacheService
|
||||||
|
├─ disabled : volatile boolean (자동 토글)
|
||||||
|
├─ errorCount : AtomicLong
|
||||||
|
├─ lastError : volatile String
|
||||||
|
│
|
||||||
|
├─ get/set/del/flush
|
||||||
|
│ └─ try {} catch { errorCount.incrementAndGet(); lastError = ...; }
|
||||||
|
│
|
||||||
|
├─ flush() ⟶ redis.execute(connection -> {
|
||||||
|
│ ScanOptions opt = match("tasteby:*").count(500);
|
||||||
|
│ while (cursor.hasNext()) keys.add(cursor.next());
|
||||||
|
│ if (!keys.isEmpty()) connection.keyCommands().unlink(keys);
|
||||||
|
│ })
|
||||||
|
│
|
||||||
|
└─ @Scheduled(fixedDelay=30_000)
|
||||||
|
checkHealth()
|
||||||
|
├ try { ping } → disabled = false (회복)
|
||||||
|
└ catch → disabled = true (또는 유지)
|
||||||
|
|
||||||
|
AdminCacheController
|
||||||
|
└─ GET /api/admin/cache/stats → { disabled, errorCount, lastError }
|
||||||
|
```
|
||||||
|
|
||||||
|
I/O ↔ 순수 로직 경계: SCAN 루프는 Redis 통신이지만 결과 처리는 단순 `for` 루프. 헬스체크는 단일 ping. 에러 기록은 atomic.
|
||||||
|
|
||||||
|
## 6. 데이터 모델
|
||||||
|
|
||||||
|
| 필드 | 타입 | 의미 |
|
||||||
|
|------|------|------|
|
||||||
|
| `disabled` | `volatile boolean` | 캐시 일시 비활성 (Redis 다운 시 true) |
|
||||||
|
| `errorCount` | `AtomicLong` | 누적 에러 횟수 (set/get/flush/del 통합) |
|
||||||
|
| `lastError` | `volatile String` | 최근 에러 메시지 (운영 디버깅용) |
|
||||||
|
|
||||||
|
응답 DTO:
|
||||||
|
```json
|
||||||
|
{ "disabled": false, "errorCount": 0, "lastError": null }
|
||||||
|
```
|
||||||
|
|
||||||
|
## 7. 함수 명세
|
||||||
|
|
||||||
|
| 함수 | 책임(1줄) | 시그니처 | 입력 | 출력 | 에러 | 복잡? |
|
||||||
|
|------|-----------|----------|------|------|------|-------|
|
||||||
|
| `CacheService.flush()` (수정) | SCAN+UNLINK 기반 prefix 삭제 | `void flush()` | - | side-effect | recordError() | **복잡** |
|
||||||
|
| `CacheService.checkHealth()` (신규) | 30초마다 ping → disabled 토글 | `void checkHealth()` (@Scheduled) | - | side-effect | disabled=true 유지 | 단순 |
|
||||||
|
| `CacheService.recordError(op, e)` (신규) | 카운터 증가 + lastError 기록 | `void recordError(String, Exception)` | op, e | side-effect | - | 단순 |
|
||||||
|
| `CacheService.getStats()` (신규) | 외부 노출용 stats | `CacheStats getStats()` | - | DTO | - | 단순 |
|
||||||
|
| `AdminCacheController.stats()` (신규) | GET endpoint | `Map stats()` | - | DTO | requireAdmin | 단순 |
|
||||||
|
|
||||||
|
## 8. 흐름 / 알고리즘
|
||||||
|
|
||||||
|
### flush (SCAN + UNLINK)
|
||||||
|
```
|
||||||
|
batch = 500 (한 번에 받는 키 수)
|
||||||
|
keys = []
|
||||||
|
redis.execute(conn ->
|
||||||
|
try (Cursor<byte[]> cursor = conn.keyCommands().scan(ScanOptions.scanOptions().match("tasteby:*").count(batch).build())) {
|
||||||
|
while (cursor.hasNext()) keys.add(new String(cursor.next()));
|
||||||
|
}
|
||||||
|
if (!keys.isEmpty()) conn.keyCommands().unlink(keys.toArray(byte[][]));
|
||||||
|
return null;
|
||||||
|
)
|
||||||
|
```
|
||||||
|
|
||||||
|
### 헬스체크
|
||||||
|
```
|
||||||
|
@Scheduled(fixedDelay = 30_000)
|
||||||
|
void checkHealth() {
|
||||||
|
if (DAEMON_ENABLED env가 false면 dev에서 노이즈 피해 skip 가능 — 단, 캐시 헬스체크는 데몬 플래그와 무관하니 항상 실행)
|
||||||
|
try (conn = factory.getConnection()) {
|
||||||
|
conn.ping();
|
||||||
|
if (disabled) { log.info("Redis recovered"); disabled = false; }
|
||||||
|
} catch (Exception e) {
|
||||||
|
if (!disabled) { log.warn("Redis lost: {}", e); disabled = true; }
|
||||||
|
}
|
||||||
|
}
|
||||||
|
```
|
||||||
|
|
||||||
|
### 에러 기록
|
||||||
|
```
|
||||||
|
catch (Exception e) {
|
||||||
|
errorCount.incrementAndGet();
|
||||||
|
lastError = op + ": " + e.getMessage();
|
||||||
|
log.warn("Cache {} error (count={}): {}", op, errorCount.get(), e.getMessage());
|
||||||
|
}
|
||||||
|
```
|
||||||
|
|
||||||
|
## 9. 엣지케이스 & 에러 처리
|
||||||
|
|
||||||
|
- **SCAN 중 다른 스레드가 키 추가/삭제**: SCAN의 best-effort 보장상 일부 키 누락 가능. flush의 자연 무효화(TTL)와 함께 작동하면 영향 미미.
|
||||||
|
- **UNLINK 미지원 Redis(2.x)**: Spring Data Redis가 fallback하지 않으므로 `DEL`로 명시 폴백. 운영 Redis는 6.x라 미지원 가능성 거의 없음.
|
||||||
|
- **헬스체크와 set/get 동시 호출**: volatile + atomic 사용. race 가능하지만 영향 작음 (잠시 후 보정).
|
||||||
|
- **로그 폭주**: 같은 에러가 매번 발생하면 WARN 로그가 폭주 — 운영에서 모니터링 후 throttle 검토 (후속).
|
||||||
|
- **fixedDelay=30s 가 너무 잦은가**: ping은 0.5ms 미만이라 무해.
|
||||||
|
|
||||||
|
## 10. 테스트 계획
|
||||||
|
|
||||||
|
- 수동:
|
||||||
|
- dev에서 Redis 임시 중단(`pm2 stop redis` 등) → 60초 후 `/api/admin/cache/stats` 의 disabled=true 확인.
|
||||||
|
- Redis 재기동 → 60초 이내 disabled=false 자동 복구 확인.
|
||||||
|
- `/api/restaurants` 호출로 캐시 set/get 작동 확인.
|
||||||
|
- 자동: Testcontainers Redis 기반 단위 테스트는 별도 후속.
|
||||||
|
|
||||||
|
## 11. 리스크 & 대안 검토
|
||||||
|
|
||||||
|
- **선택**: SCAN + UNLINK + @Scheduled 헬스체크.
|
||||||
|
- **대안 A**: TTL만 의존(flush 폐기) — 단순하지만 즉시 무효화 불가, 어드민 강제 무효화 시나리오 손상.
|
||||||
|
- **대안 B**: Redis 6.0+의 `FLUSHDB ASYNC` — 더 단순하지만 prefix 격리 안 됨(다른 앱이 같은 Redis 공유 시 위험). tasteby Redis는 전용이라 가능하지만 일반화 위해 SCAN/UNLINK 채택.
|
||||||
|
- **대안 C**: Lettuce native `RedisAsyncCommands.scan` 직접 사용 — 더 빠르지만 추상화 레벨 낮춤.
|
||||||
|
- **트레이드오프**: SCAN은 N개 키마다 cursor 왕복 발생 → flush 1회 latency 증가(키 1만 개 기준 ~50ms). 비동기 UNLINK로 삭제는 빠름.
|
||||||
|
|
||||||
|
## 12. 미해결 질문
|
||||||
|
|
||||||
|
- Micrometer 메트릭(JVM/캐시) 도입 시 errorCount를 prom으로 export — 별도 후속.
|
||||||
|
- Redis sentinel/cluster 도입 시 헬스체크 의미 재정의 — 현재 단일 인스턴스라 무관.
|
||||||
|
- `lastError` 노출이 운영자에게 충분한가, 또는 sliding window가 필요한가 — 운영 24h 관찰 후 결정.
|
||||||
114
docs/design/337-stats-bot-ratelimit/README.md
Normal file
114
docs/design/337-stats-bot-ratelimit/README.md
Normal file
@@ -0,0 +1,114 @@
|
|||||||
|
# 설계서: 통계 방문 카운트 봇 필터 + 레이트리밋 (#337)
|
||||||
|
|
||||||
|
> **상태**: Approved
|
||||||
|
> **작성**: [AI] Architect · **최종수정**: 2026-06-15
|
||||||
|
> **추적성** — Redmine: #337 · 부모: #274 (현행화 backend-stats, 09-Done)
|
||||||
|
> · 구현 파일: `backend-java/build.gradle`, `backend-java/src/main/java/com/tasteby/controller/StatsController.java`, `backend-java/src/main/java/com/tasteby/util/BotDetector.java` (신규), `backend-java/src/main/java/com/tasteby/service/RateLimitService.java` (신규)
|
||||||
|
> · 테스트: 수동 (curl로 봇 UA + 같은 IP 다중 호출)
|
||||||
|
|
||||||
|
## 1. 목적 (Why)
|
||||||
|
|
||||||
|
`POST /api/stats/visit`이 인증 없이 누구나 호출 가능 + 봇/크롤러 필터 없음 → (a) 일반 봇이 사이트 인덱싱하면서 카운터 인플레이션, (b) 악의적 새로고침 어뷰즈로 통계 왜곡. 또한 페이지 로드마다 DB write QPS 증가 — 클라이언트 어뷰즈에 취약.
|
||||||
|
|
||||||
|
## 2. 범위 (Scope)
|
||||||
|
|
||||||
|
- **포함**
|
||||||
|
- User-Agent 기반 봇 패턴 필터 (Googlebot, bingbot, crawler 등 일반 패턴).
|
||||||
|
- IP 기반 레이트리밋: 같은 IP에서 1분에 1회만 카운트 (Bucket4j + Redis).
|
||||||
|
- X-Forwarded-For 헤더 우선 (Nginx Ingress 뒤이므로).
|
||||||
|
- 봇/리밋 초과: 200 응답하되 카운터 미증가 (사용자 경험 영향 X).
|
||||||
|
- **제외 (out of scope)**
|
||||||
|
- WAF 수준 봇 차단 (Cloudflare 등).
|
||||||
|
- UU(고유 방문자) — 별도 후속 (쿠키/세션).
|
||||||
|
- Redis INCR 기반 비동기 통계 (DB write 분리) — 별도 후속.
|
||||||
|
|
||||||
|
## 3. 인수조건
|
||||||
|
|
||||||
|
- [ ] build.gradle에 bucket4j-redis 추가.
|
||||||
|
- [ ] User-Agent에 'bot'/'crawler'/'spider' 포함 시 카운트 skip + 디버그 로그.
|
||||||
|
- [ ] 같은 IP에서 60초 안에 두 번째 visit 호출 시 카운트 skip.
|
||||||
|
- [ ] 응답은 항상 `{ "ok": true, "counted": bool }` 형태.
|
||||||
|
- [ ] 봇/리밋 초과 호출도 200 응답 (사용자 페이지 로드 지장 X).
|
||||||
|
- [ ] 운영 배포 후 회귀 없음 — 통계 카운터가 정상 증가.
|
||||||
|
|
||||||
|
## 4. 컨텍스트 & 제약
|
||||||
|
|
||||||
|
- Bucket4j 8.x + Redis backend (Lettuce 호환).
|
||||||
|
- 메모리만 사용하는 경우(단일 파드) ConcurrentLinkedHashMap도 가능하나 ShedLock 사례처럼 멀티 파드 미래 대비 Redis.
|
||||||
|
- 운영 트래픽 작아 Bucket4j 부하 미미.
|
||||||
|
- 1분 1회 정책은 동일 IP에서 사용자가 페이지 새로고침해도 영향 작음. 너무 빡빡하면 다중 사용자 NAT(회사/카페) 영향 → 1분/IP는 균형.
|
||||||
|
|
||||||
|
## 5. 아키텍처 개요
|
||||||
|
|
||||||
|
```
|
||||||
|
사용자 페이지 로드
|
||||||
|
│
|
||||||
|
▼ POST /api/stats/visit (X-Forwarded-For: client-ip)
|
||||||
|
StatsController.recordVisit(req)
|
||||||
|
│
|
||||||
|
├─ BotDetector.isBot(userAgent) → skip
|
||||||
|
│
|
||||||
|
├─ RateLimitService.tryConsume(clientIp) → false면 skip
|
||||||
|
│
|
||||||
|
▼
|
||||||
|
StatsService.recordVisit() → DB MERGE
|
||||||
|
```
|
||||||
|
|
||||||
|
## 6. 데이터 모델
|
||||||
|
|
||||||
|
Redis 키:
|
||||||
|
- `bucket4j:visit:<ip>` — Bucket4j가 자동 관리 (token bucket state)
|
||||||
|
|
||||||
|
응답:
|
||||||
|
```json
|
||||||
|
{ "ok": true, "counted": true } // 정상 카운트
|
||||||
|
{ "ok": true, "counted": false } // 봇/리밋 초과
|
||||||
|
```
|
||||||
|
|
||||||
|
## 7. 함수 명세
|
||||||
|
|
||||||
|
| 함수 | 책임 | 시그니처 | 비고 |
|
||||||
|
|------|------|----------|------|
|
||||||
|
| `BotDetector.isBot(ua)` | UA 문자열 봇 패턴 매칭 | `static boolean isBot(String)` | 순수 함수 |
|
||||||
|
| `RateLimitService.tryConsume(key)` | Bucket4j 1 토큰 소비 | `boolean tryConsume(String)` | Bucket 1/min |
|
||||||
|
| `StatsController.recordVisit(req)` (수정) | 봇 + IP 필터 후 카운트 | `@PostMapping("/visit")` | request 헤더 활용 |
|
||||||
|
|
||||||
|
## 8. 흐름
|
||||||
|
|
||||||
|
1. POST `/api/stats/visit` 진입.
|
||||||
|
2. `X-Forwarded-For` 우선 → 없으면 `request.getRemoteAddr()`.
|
||||||
|
3. User-Agent 검사 (`isBot` true면 counted=false).
|
||||||
|
4. IP 레이트 검사 (`tryConsume` false면 counted=false).
|
||||||
|
5. 통과 시 `recordVisit()` 호출.
|
||||||
|
6. 응답 `{ok:true, counted: ...}`.
|
||||||
|
|
||||||
|
## 9. 엣지케이스
|
||||||
|
|
||||||
|
- **여러 IP가 헤더에 chain**: X-Forwarded-For 첫 번째(원본 클라이언트) 사용.
|
||||||
|
- **헤더 위조**: Nginx Ingress 뒤라 외부 위조는 어렵지만, 신뢰는 가정.
|
||||||
|
- **Redis 다운**: Bucket4j Redis 에러 → fail open(즉, counted=true 진행). 통계는 약간 부풀지만 사용자 경험 우선.
|
||||||
|
- **빈 UA**: 봇 판정 안 함 (정상 모바일 앱일 수도).
|
||||||
|
|
||||||
|
## 10. 테스트
|
||||||
|
|
||||||
|
- 수동:
|
||||||
|
```
|
||||||
|
curl -X POST -H "User-Agent: Googlebot/2.1" https://www.tasteby.net/api/stats/visit
|
||||||
|
→ counted=false
|
||||||
|
curl -X POST -H "User-Agent: Mozilla/5.0" https://www.tasteby.net/api/stats/visit
|
||||||
|
→ counted=true
|
||||||
|
(즉시 재호출) → counted=false (rate limit)
|
||||||
|
```
|
||||||
|
|
||||||
|
## 11. 리스크 & 대안
|
||||||
|
|
||||||
|
- **선택**: Bucket4j + Redis backend + UA 정규식.
|
||||||
|
- **대안 A**: 메모리 LRU만 사용 — 단일 파드는 OK, 멀티 파드는 어뷰즈 가능.
|
||||||
|
- **대안 B**: Nginx Ingress에서 rate limit — 인프라 분리 깔끔. 다만 봇 UA 필터는 ingress nginx 모듈 추가 부담, 어플리케이션 가시성↓.
|
||||||
|
- **대안 C**: 비동기 큐(@Async 또는 Redis INCR) — DB write 부담 해소. 본 이슈는 어뷰즈 차단이 우선이라 후속으로 분리.
|
||||||
|
|
||||||
|
## 12. 미해결 질문
|
||||||
|
|
||||||
|
- UU(쿠키 기반 고유 방문자) — 별도 후속 (#274 후속 #337의 잔여 항목으로 분리).
|
||||||
|
- Bucket4j 1분 정책의 적정성 — 운영 1주일 관찰 후 조정.
|
||||||
|
- 봇 UA 화이트리스트(친화적 검색 엔진은 카운트 포함?) — 현재 일괄 skip.
|
||||||
Reference in New Issue
Block a user