- government/ Node 데몬: Open API 우선 + HTML 보조 + 디스커버리 전략 - Strategy 패턴 소스 어댑터: KStartupApiSource(공공데이터 Open API), GenericHtmlSource(config 기반) - sundol 3단계 폴백 크롤러(cheerio→Jina→Playwright CDP) Node 재구현, sundol-chrome(9222) 재사용 - Oracle thick 모드(Instant Client + sso 지갑) 접속, gov_source/gov_opportunity 적재(중복제거) - K-Startup 29,017건 + 중기부(mss) 30건 적재 검증, PM2 gov-daemon 등록(60분 주기) - 기업마당(bizinfo)은 자체 crtfcKey 발급 대기 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
20 lines
504 B
JSON
20 lines
504 B
JSON
{
|
|
"name": "gov-scraper",
|
|
"version": "0.1.0",
|
|
"private": true,
|
|
"type": "module",
|
|
"description": "정부지원사업 공고 수집 데몬 (Open API 우선 + HTML 보조)",
|
|
"scripts": {
|
|
"daemon": "node src/daemon.js",
|
|
"run-once": "node src/cli.js run-once",
|
|
"test-db": "node src/cli.js test-db",
|
|
"test-crawl": "node src/cli.js test-crawl"
|
|
},
|
|
"dependencies": {
|
|
"cheerio": "^1.0.0",
|
|
"dotenv": "^16.4.5",
|
|
"oracledb": "^6.5.1",
|
|
"playwright-core": "^1.49.0"
|
|
}
|
|
}
|