- BizinfoApiSource: bizinfo.go.kr 자체 crtfcKey 사용, /uss/rss/bizinfoApi.do - 페이지네이션 없음 → totCnt 파악 후 전체 일괄 요청(1,463건 검증) - bsnsSumryCn(HTML) 본문 → stripHtml 로 태그 제거, 단일패스 적재(전건 DETAILED) - reqstBeginEndDe "YYYY-MM-DD ~ ..." → 신청기간 파싱(706건), 텍스트형은 null - util: stripHtml, parsePeriodRange 추가 - 데몬 4소스 가동: kstartup/bizinfo/mss/smes Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2.0 KiB
2.0 KiB
정부지원사업 소스 카탈로그 (디스커버리 결과)
Claude WebSearch 로 수집한 공고 소스 후보. 상태가 구현인 것만 데몬이 수집한다.
| 코드 | 소스 | URL | 방식 | 키 | 상태 |
|---|---|---|---|---|---|
| kstartup | K-Startup 창업지원 공고 | k-startup.go.kr | Open API | data.go.kr 서비스키 | ✅ 구현·검증 |
| mss | 중소벤처기업부 사업공고 | mss.go.kr (cbIdx=310) | HTML 게시판 | 불필요 | ✅ 구현·검증 |
| bizinfo | 기업마당 지원사업정보 | bizinfo.go.kr | Open API(자체) | bizinfo crtfcKey |
✅ 구현·검증 |
| smes | 중소벤처24 사업공고 | smes.go.kr (bizApply) | HTML(목록전용) | 불필요 | ✅ 구현·검증 |
| g2b | 나라장터(입찰/조달) | g2b.go.kr | Open API(data.go.kr) | 서비스키 | 🔲 후보 |
| 부처/지자체 | 각 부처·지자체 게시판 | 다수 | HTML(GenericHtml) | 불필요 | 🔲 디스커버리 확장 |
핵심 메모
- 커버리지: 기업마당 + K-Startup 두 API 가 정부지원사업 공고의 대부분을 집계. 기업마당 키 확보가 다음 우선순위.
- 키 체계 주의: 기업마당은 data.go.kr 가 아니라 bizinfo.go.kr 자체 인증키(
crtfcKey)를 쓴다. data.go.kr 서비스키와 별개. 엔드포인트:https://www.bizinfo.go.kr/uss/rss/bizinfoApi.do?crtfcKey=...&dataType=json - HTML 확장: 부처/지자체 게시판은 대부분 정적 렌더링 표(table)라
GenericHtmlSourceconfig 로 코드 수정 없이 추가 가능(mss 사례 참조). - smes 상세 제약: smes 상세는 팝업 전용(JS 다이얼로그)이라 단독 크롤 불가 → 목록 전용(
listOnly)으로 적재. 목록에 제목·기관·분야·신청기간이 모두 있어 충분. 본문은 동일 PBLN 의 기업마당 API 로 보강 예정.
참고 링크
- 기업마당 API: https://www.bizinfo.go.kr/web/lay1/program/S1T175C174/apiList.do
- K-Startup API(data.go.kr): https://www.data.go.kr/data/15125364/openapi.do
- 중소벤처24: https://www.smes.go.kr/main/bizApply