储能产业链 · 数据栏目
本栏目对应「储能产业链抓取与栏目 MVP」计划:多来源抓取 → 归一与实体链接 → 打标与去重评分 → 结构化 JSON → 企业名录与事件流静态页。支持定时更新与后续运营扩展。
流水线(Mermaid 逻辑图)
sourceIn[SourceCollectors] --> rawStore[RawItems] rawStore --> normalizeStep[NormalizeParse] normalizeStep --> entityLink[EntityResolution] entityLink --> taggerStep[TaggingRules] taggerStep --> dedupeStep[DedupeAndScoring] dedupeStep --> dataStore[StructuredJSON] dataStore --> renderCompany[RenderCompanyDirectory] dataStore --> renderEvents[RenderEventStream] renderCompany --> webOut[WebsitePages] renderEvents --> webOut
栏目入口
企业名录侧重主体与角色标签;事件流侧重招标/中标/项目动态等时间线与原文链接。
标签体系(MVP 计划)
一级分类与二级标签与企业名录、事件流共用;抓取后经归一、打标与去重写入结构化 JSON。
上游
- 电芯制造
- 线束电缆
- PCS
- BMS
- EMS
- 温控
- 消防
中游集成与EPC
- 系统集成商
- EPC总包
- 设计院
- 运维
EMC投资
- 第三方投资方
- 央国企资本
- 产业资本
- 基金VC
需求侧
- 工商业园区
- 制造工厂
- 数据中心
- 微电网
运营与质量(摘要)
- 采集:可先日更 2 次,再按稳定性扩充。
- 去重:标题相似 + 同日同主体倾向合并,保留更权威来源。
- 人工:每日抽样 10~20 条,迭代标签词典与别名表。