系统边界

系统边界

这套仓库的主链路始终围绕 S3 -> OCR -> Embedding -> S3 Vectors,不同页面只是在展示这些边界与缺口。

Ingest Lambda

唯一对外入口,负责接收 S3 事件、执行版本化和幂等校验,并启动 Step Functions。

Extract Lambda / State Machine

负责 OCR 提交、轮询、结果持久化、manifest 落盘,以及 embedding job 的分发。

Embed Lambda

按 embedding profile 消费队列,写入独立 S3 Vectors index,并回写 projection state。

MCP Gateway

负责多 profile 召回、RRF 融合、neighbor 扩展和 latest_version_id 兜底校验。

开放缺口

仍然需要补齐的部分

主链路保持不变:S3 → OCR → Embedding → S3 Vectors。

返回控制台