Files
sundol/government/docs/sources-catalog.md
joungmin f2a8f30867 gov-scraper: 중소벤처24(smes) 사업공고 소스 추가
- GenericHtmlSource 확장: 신청기간(period) 날짜 파싱, listOnly(목록 전용) 모드
- smes(중소벤처24 bizApply) config 추가 — href의 PBLN 공고ID 추출, 제목/분야/주관기관/신청기간 적재
- smes 상세는 팝업 전용(JS 다이얼로그)이라 직접 크롤 불가 → 목록 전용으로 적재(18건 검증)
- util: parseFlexibleDate(YY-MM-DD/YYYYMMDD 대응)
- pipeline: skipDetail 소스는 상세 단계 건너뜀

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-10 05:51:46 +00:00

2.0 KiB

정부지원사업 소스 카탈로그 (디스커버리 결과)

Claude WebSearch 로 수집한 공고 소스 후보. 상태가 구현인 것만 데몬이 수집한다.

코드 소스 URL 방식 상태
kstartup K-Startup 창업지원 공고 k-startup.go.kr Open API data.go.kr 서비스키 구현·검증
mss 중소벤처기업부 사업공고 mss.go.kr (cbIdx=310) HTML 게시판 불필요 구현·검증
bizinfo 기업마당 지원사업정보 bizinfo.go.kr Open API(자체) bizinfo crtfcKey(별도신청) 키 대기
smes 중소벤처24 사업공고 smes.go.kr (bizApply) HTML(목록전용) 불필요 구현·검증
g2b 나라장터(입찰/조달) g2b.go.kr Open API(data.go.kr) 서비스키 🔲 후보
부처/지자체 각 부처·지자체 게시판 다수 HTML(GenericHtml) 불필요 🔲 디스커버리 확장

핵심 메모

  • 커버리지: 기업마당 + K-Startup 두 API 가 정부지원사업 공고의 대부분을 집계. 기업마당 키 확보가 다음 우선순위.
  • 키 체계 주의: 기업마당은 data.go.kr 가 아니라 bizinfo.go.kr 자체 인증키(crtfcKey)를 쓴다. data.go.kr 서비스키와 별개. 엔드포인트: https://www.bizinfo.go.kr/uss/rss/bizinfoApi.do?crtfcKey=...&dataType=json
  • HTML 확장: 부처/지자체 게시판은 대부분 정적 렌더링 표(table)라 GenericHtmlSource config 로 코드 수정 없이 추가 가능(mss 사례 참조).
  • smes 상세 제약: smes 상세는 팝업 전용(JS 다이얼로그)이라 단독 크롤 불가 → 목록 전용(listOnly)으로 적재. 목록에 제목·기관·분야·신청기간이 모두 있어 충분. 본문은 동일 PBLN 의 기업마당 API 로 보강 예정.

참고 링크