一次前后端架构与调用流程整理

最近维护一套前端和 Python 后端时，我对前后端分离这件事有了更清楚的感受。

它不只是把页面和接口放在两个目录里，而是要把每一层负责什么、数据怎么流动、任务什么时候同步返回、什么时候丢给后台处理想清楚。

技术栈概览

前端这一侧，我更关心的是页面、组件、状态、API client、Mock 和代理这些边界。

页面负责把用户操作组织成清楚的交互，组件负责复用和展示，状态管理负责让页面之间的数据变化可控，API client 则把请求细节收在一起。这样后端接口调整时，前端不会到处散落重复的请求逻辑。

后端这一侧，主要是 Python 方向：

FastAPI 负责 HTTP 入口和路由组织。
Uvicorn 负责 ASGI 运行时。
Pydantic 负责请求、响应和数据结构约束。
SQLAlchemy 负责数据库模型和查询。
Alembic 负责数据库迁移。
PostgreSQL 负责持久化数据。
httpx 负责调用外部 HTTP 能力。
Kafka 负责把耗时任务从同步请求里拆出去。
对象存储负责放文件、图片、视频等大对象。
worker 负责消费任务、调用外部能力、更新状态。

这些东西拆开看都是独立工具，但真正写项目时，重点是让它们在同一条调用链里各自只做该做的事情。

后端分层

我现在更倾向于把后端按入口、结构、编排、存储和外部能力来分。

落到目录上，可以大致让 core 放配置、数据库、鉴权、异常、日志、请求上下文和运行时预检；让 routers、schemas、services、models、providers 分别对应接口入口、契约结构、业务编排、持久化模型和外部能力适配。复杂一点的领域能力，再继续在 services 下按业务拆子目录，不要把所有逻辑都堆到一个大 service 里。

router 是 HTTP 入口，只处理路由、鉴权后的上下文、请求参数和响应出口。它不应该塞太多具体逻辑，否则接口多起来后会很难维护。

schema 用来描述输入和输出。它的价值不是多写几个类型，而是让前后端都知道“这个接口接受什么、返回什么、错误时大概是什么结构”。

service 放主要编排逻辑。比如创建任务、检查状态、写数据库、决定是否投递异步消息，都应该在这里组织。这样 router 可以薄一点，后面写测试或者换入口也更容易。

model 对应数据库结构。这里要稳定、明确，不能因为前端页面临时想要一个字段，就随手把结构揉在一起。

provider 或 client 更像外部能力的适配层。无论是调用模型服务、文件服务，还是别的 HTTP 服务，都应该把外部差异收在这里，不要让 service 到处感知不同平台的细节。

worker 负责异步执行。它不直接面向用户请求，而是从消息队列或任务表里拿工作，执行后再把状态写回去。

另外还有一些容易被忽略但很重要的横切能力，比如统一错误结构、请求 id、访问日志、健康检查、就绪检查、敏感信息脱敏和生产环境配置校验。它们不属于某个业务接口，但会决定系统出了问题时能不能定位。

前后端同步调用流程

普通接口适合走同步链路。比如查询列表、保存配置、读取详情这类事情，前端发请求，后端处理完直接返回结果。

flowchart LR
  Page["页面交互"] --> ApiClient["API client<br/>组装请求"]
  ApiClient --> Router["FastAPI router<br/>接收 HTTP 请求"]
  Router --> SchemaIn["schema<br/>校验输入结构"]
  SchemaIn --> Service["service<br/>执行业务编排"]
  Service --> Database["model / database<br/>读写数据"]
  Database --> SchemaOut["schema<br/>整理响应结构"]
  SchemaOut --> Result["API client<br/>接收结果"]
  Result --> State["页面状态更新"]

这条链路里，前端不应该关心数据库怎么查，后端也不应该关心按钮在哪里。双方真正共享的是接口契约。

我觉得这里最重要的是三件事：

请求参数要稳定，不要让前端靠猜。
错误结构要统一，不要每个接口一种格式。
返回数据要贴近页面需要，但不要把页面状态直接变成数据库结构。

Kafka 异步调用流程

有些任务不适合在 HTTP 请求里一直等。

例如需要调用外部能力、处理文件、生成结果、上传对象存储，或者执行时间不稳定的任务，就更适合拆成“创建任务”和“后台处理”两段。

sequenceDiagram
  participant Page as 页面
  participant API as API client
  participant Service as service
  participant Database as database
  participant Outbox as outbox
  participant Publisher as publisher
  participant Kafka as Kafka
  participant Inbox as inbox
  participant Worker as worker
  participant Provider as provider / client
  participant Storage as object storage

  Page->>API: 提交任务
  API->>Service: 创建 Task
  Service->>Database: 写入 pending 状态
  Service->>Outbox: 写入待投递 Message
  Service-->>API: 返回 Task id
  API-->>Page: 更新为等待状态
  Publisher->>Outbox: 拉取待投递消息
  Publisher->>Kafka: 投递 Message
  Kafka-->>Inbox: 分发 Message
  Inbox->>Inbox: 按 message id 去重
  Inbox-->>Worker: 交给消费逻辑处理
  Worker->>Provider: 调用外部能力
  Worker->>Storage: 保存 File
  Worker->>Database: 更新 Task 状态和 Result
  Page->>API: 查询 Task 结果

这条链路的重点不是“用了 Kafka”，而是把耗时和不稳定的部分从用户请求里拆出来。

HTTP 请求只负责确认任务已经创建。真正耗时的工作交给 worker。前端拿到任务 id 后，只需要根据状态展示“等待中、处理中、成功、失败”。

这里最好把消息链路再分清楚一点。outbox 更像发件箱：业务数据和待发送消息在同一个事务里写入，避免“任务创建了但消息没发出去”。独立的 publisher 负责扫描待发送消息、投递 Kafka、记录重试次数，失败太多就进入死信状态。

inbox 更像收信箱：consumer 收到消息后，先用 message id + consumer name 判断这条消息有没有处理过，再执行业务逻辑并把收信记录和业务更新一起提交。这样即使 Kafka 重投、consumer 重启，后端也能尽量避免重复执行同一条任务。

这样做的好处是：

页面不会被一个长请求卡住。
后端可以控制任务重试和失败状态。
worker 可以独立扩展。
文件和大结果可以放到对象存储，不必塞进普通响应里。
后续排查问题时，可以沿着 Task 状态看链路走到哪一步。

如果异步链路再复杂一点，我会把长期运行的进程继续拆成不同角色：有的只负责 outbox 投递，有的只负责 Kafka 消费和 inbox 去重，有的负责调度不同区域或不同能力的任务，有的专门处理文件转存和回调。这样做不是为了目录好看，而是为了让每个进程都有清楚的职责、配置和健康检查。

状态和幂等

异步任务一多，状态设计就会变得很重要。

我会倾向于让任务状态保持清楚，比如：

flowchart LR
  Pending["pending"] --> Queued["queued"]
  Queued --> Running["running"]
  Running --> Succeeded["succeeded"]
  Running --> Failed["failed"]

每个状态都应该能回答一个问题：现在任务走到哪里了，用户应该看到什么，后端还会不会继续处理。

同时，创建任务和消费消息都要考虑幂等。网络重试、消息重复、worker 重启都可能发生。如果同一条消息被消费两次，系统也应该尽量不要生成两份结果，或者把状态写乱。

这里可以通过任务 id、message id、状态检查、唯一约束、处理锁、outbox 重试和 inbox 去重等方式降低问题概率。具体怎么做要看场景，但这个意识本身很重要。

前后端边界

维护到后面，我会越来越在意边界。

前端应该负责：

页面状态和交互节奏。
表单校验和基础提示。
API client 封装。
错误展示和加载状态。
Mock 或代理环境下的联调体验。

后端应该负责：

数据结构和核心规则。
权限、状态流转和一致性。
数据库读写。
外部能力适配。
异步任务、重试和最终状态。

如果前端为了赶页面，把后端规则也复制一份，后面就容易两边不一致。如果后端把所有页面展示细节都塞进接口里，接口也会变得很难复用。

好的边界不是完全不重叠，而是知道哪些地方可以重复一点，哪些地方必须只有一个权威来源。

我现在的理解

这类架构最核心的不是某一个框架，而是调用链路能不能被说清楚。

一个请求从页面发出后，经过了哪个 API client、进了哪个 router、由哪个 service 编排、写了什么状态、什么时候投递消息、worker 怎么接手、结果怎么回到页面，这些都应该能顺着讲明白。

能讲清楚，才说明自己不是只在改某一小块代码，而是真的知道这个系统为什么这样拆、出了问题应该从哪里查、以后要扩展时应该往哪里放。

这也是我现在维护前端和 Python 后端时，觉得最有价值的一点。

Python FastAPI Kafka 前后端分离