7bc0464afc
gov-scraper: 본문 지원자격 지역제한 필터 추가
...
- generate_checklist.js: 본문에 '비서울 지역 + 거주/소재/관내/재학' 정방향 패턴이면 제외
- 서울/수도권/전국 포함 시 유지(서울 거주자 가능), 서울 기관 사업도 유지
- 역방향(주소+지역)은 기관 연락처 푸터 오탐이라 미검사
- apply-checklist.md: 지역(제목+주관+본문)+연령+성별/대상 → 109건
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 08:13:29 +00:00
f3587eb130
gov-scraper: 신청 체크리스트 성별/특수대상 필터 추가
...
- generate_checklist.js: 남성 기준 여성 전용 제외, 특수대상(장애인/보훈/다문화/북한이탈) 전용 제외
- 제목+주관기관 기준(본문 '우대' 가점 언급은 미검사로 오제거 방지)
- 지역 보완: 달구벌(=대구) 추가
- apply-checklist.md: 지역+연령+성별/대상 누적 적용 → 117건
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 08:03:07 +00:00
ffdcea009d
gov-scraper: 신청 체크리스트 연령(46세) 필터 추가
...
- generate_checklist.js: 본문 연령 상한 추출(만 N세 이하/범위) → 46세 미만이면 제외
- 제목 '청년/대학생' = 청년한정 제외, 단 '중장년/만40+이상/연령무관' 신호 있으면 유지
- apply-checklist.md: 지역(서울) + 연령(46세) 적용 → 252→122건
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 07:57:23 +00:00
ad8d200474
gov-scraper: 신청 체크리스트 서울 거주 지역필터 적용
...
- generate_checklist.js: 서울 거주 기준 타 지역 한정 공고 제외(접두/주관기관 + 안전한 도·권역은 제목 본문까지)
- apply-checklist.md: 252→137건(타지역 115건 제외), 서울+전국 공고만 유지
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 07:52:33 +00:00
afff7a4703
gov-scraper: 신청 체크리스트(apply-checklist.md) 추가
...
- docs/apply-checklist.md: 예비창업자 자격 + 현재 열린 공고 252건, 마감일 그룹별 체크박스 + URL
- scripts/generate_checklist.js: DB에서 체크리스트 재생성(추적 대상 docs/에 출력)
- 신청 완료 시 [x] 체크하며 진행, 스크립트로 갱신 가능
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 07:41:47 +00:00
e48a45bf71
gov-scraper: 제출용 사업계획서 완성본 추가(시장수치·경쟁사·출처 포함)
...
- docs/business-plans-full.md: 3개 앱 PSST + TAM/SAM/SOM + 경쟁사 비교표
- 시장조사(병렬 리서치) 반영: 출처·연도 병기, 추정치 명시
- Tasteby: 외식 153조, 캐치테이블/식신, 숏폼 맛집 통계, 데이터바우처
- Lyricsy: 언어학습 $837억, 한류 2.25억명, Duolingo, 가사 라이선스(LyricFind/KOMCA)
- Parents Story: 초고령사회 20.3%, 고령친화 80조, 온디바이스 AI, 경쟁사 전부 클라우드
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 07:36:52 +00:00
cdce7b86bb
gov-scraper: 마스터 사업계획서 + 공고 매칭/추출 스크립트 추가
...
- docs/business-plans.md: Tasteby/Lyricsy/Parents Story 3개 앱 PSST 사업계획서 초안
- scripts/match.js: 앱별 주제 키워드 매칭 조회
- scripts/eligible.js: 예비창업자 자격 + 현재 열린 공고 목록
- scripts/export_eligible_csv.js: 신청 추적용 CSV(exports/) 생성
- exports/ gitignore
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 07:24:39 +00:00
82504e2261
gov-scraper: 기업마당(bizinfo) Open API 소스 추가
...
- BizinfoApiSource: bizinfo.go.kr 자체 crtfcKey 사용, /uss/rss/bizinfoApi.do
- 페이지네이션 없음 → totCnt 파악 후 전체 일괄 요청(1,463건 검증)
- bsnsSumryCn(HTML) 본문 → stripHtml 로 태그 제거, 단일패스 적재(전건 DETAILED)
- reqstBeginEndDe "YYYY-MM-DD ~ ..." → 신청기간 파싱(706건), 텍스트형은 null
- util: stripHtml, parsePeriodRange 추가
- 데몬 4소스 가동: kstartup/bizinfo/mss/smes
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-11 06:33:27 +00:00
f2a8f30867
gov-scraper: 중소벤처24(smes) 사업공고 소스 추가
...
- GenericHtmlSource 확장: 신청기간(period) 날짜 파싱, listOnly(목록 전용) 모드
- smes(중소벤처24 bizApply) config 추가 — href의 PBLN 공고ID 추출, 제목/분야/주관기관/신청기간 적재
- smes 상세는 팝업 전용(JS 다이얼로그)이라 직접 크롤 불가 → 목록 전용으로 적재(18건 검증)
- util: parseFlexibleDate(YY-MM-DD/YYYYMMDD 대응)
- pipeline: skipDetail 소스는 상세 단계 건너뜀
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-10 05:51:46 +00:00
cbc5ba5663
정부지원사업 공고 수집 데몬(gov-scraper) 추가
...
- government/ Node 데몬: Open API 우선 + HTML 보조 + 디스커버리 전략
- Strategy 패턴 소스 어댑터: KStartupApiSource(공공데이터 Open API), GenericHtmlSource(config 기반)
- sundol 3단계 폴백 크롤러(cheerio→Jina→Playwright CDP) Node 재구현, sundol-chrome(9222) 재사용
- Oracle thick 모드(Instant Client + sso 지갑) 접속, gov_source/gov_opportunity 적재(중복제거)
- K-Startup 29,017건 + 중기부(mss) 30건 적재 검증, PM2 gov-daemon 등록(60분 주기)
- 기업마당(bizinfo)은 자체 crtfcKey 발급 대기
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com >
2026-06-10 04:36:50 +00:00