Python 大模型应用开发 MOC

Python 在大模型应用开发中的技术栈、架构、学习路线和典型项目形态总入口。

#type / moc #status / growing #tech / ai #resource / python

[!info] related notes

上层 MOC: ai-moc

关系笔记: javascript-vs-python-ai-libraries

相关 MOC: python-moc

Python 大模型应用开发 MOC

Python 是大模型应用开发的工程底座。本地图覆盖从模型接入到产品上线的完整技术栈。

这张地图覆盖什么

本 MOC 聚焦 Python 在大模型应用开发（而非模型训练）中的角色，包括：

模型 API 接入与服务化
RAG（检索增强生成）
Agent 与工具调用
文档解析与数据处理
评测与追踪
典型架构与学习路线

从这里开始

定位：Python 在大模型应用里做什么

Python 在大模型应用中不是”让模型更聪明”，而是把模型、数据、工具和业务流程拼成可上线系统。它的核心优势是生态拼图完整：一门语言同时覆盖 API 服务、参数校验、文档解析、数据清洗、RAG、Agent、本地模型和评测。

技术栈分层

前端/客户端 → FastAPI 接口层 → OpenAI SDK 调模型
                ↓
        文档解析 + Embeddings + 检索（RAG）
                ↓
        Tool Calling / Agent Workflow
                ↓
        评测 / 追踪 / 部署

核心笔记

1. 服务层：把模型包成产品接口

fastapi - Python 高性能 API 框架（基于 type hints，自带交互式文档）
[[pydantic]] - 数据验证与序列化（请求参数、响应数据、工具参数）

典型代码：

from fastapi import FastAPI
from pydantic import BaseModel
from openai import OpenAI

app = FastAPI()
client = OpenAI()

class ChatRequest(BaseModel):
    message: str

@app.post("/chat")
def chat(req: ChatRequest):
    resp = client.responses.create(
        model="YOUR_MODEL",
        input=req.message,
    )
    return {"answer": resp.output_text}

2. 模型接入层：调模型 API

OpenAI Python SDK - 同步/异步客户端，支持 Responses API、Structured Outputs、function calling、embeddings
Anthropic SDK - Claude 模型接入
Python 调用 AI 接口 - 用 requests 直接调用 OpenRouter API（流式示例）

3. 数据与文档处理层（Python 的杀手锏）

pandas - 结构化数据清洗与分析
Unstructured - 非结构化文档 ingest 和 preprocessing（PDF/Word/HTML/图片）
pdfplumber - PDF 文本、表格提取与可视化调试

为什么这一层关键：很多”AI 应用不好做”的难点，卡在数据处理，不在 prompt 本身。

4. RAG 层：带自己的数据

LlamaIndex - 偏数据/RAG，完整的 query engine、agent 路线
langchain - RAG、tool use、structured output 和 agent 开发框架
Haystack - production-ready 的 agents、RAG 和 multimodal search

RAG 基本流程：文档解析 → 切块 → embedding → 向量索引/数据库 → 检索 → 重排/拼接上下文 → 模型回答

5. Agent 与工具调用层：让模型做事

OpenAI Agents SDK - agent primitives、sessions、tracing、human-in-the-loop
langgraph - 可控编排、durable execution、streaming
crewai - 多 agent 团队协作与 Flow 编排

核心能力：模型通过 tool calling 访问训练数据之外的外部系统，执行查订单、发邮件、创建任务等操作。

6. 本地模型与训练层（可选，进阶）

Hugging Face Transformers - 多模态模型的推理与训练
PyTorch - GPU/CPU 深度学习张量库

适用场景：跑开源模型、本地推理、微调、蒸馏、批量离线处理。

7. 评测与追踪层

OpenAI Evals - 程序化评估，可复现的质量测试
OpenAI Agents SDK 内置 tracing - 可观测性
langsmith - LangChain 生态常用的 tracing、debug、eval 和 monitoring 平台

为什么需要：成熟应用不是”看起来能跑”，而是”稳定、成本可控、出错能发现”。

学习路线

推荐按此顺序学习，而非一上来就冲 Agent：

Python 基础：函数、类、typing、虚拟环境、包管理、异步基础
FastAPI + Pydantic：先学会把 AI 能力做成可靠接口
OpenAI SDK：Responses、Structured Outputs、function calling、embeddings
数据处理：pandas 处理表格和日志，Unstructured 处理 PDF/Word/HTML
RAG 框架：LlamaIndex（偏数据）或 langchain（偏通用框架）或 Haystack（偏组件式）
Agent 与评测：OpenAI Agents SDK、langgraph 或 crewai，再补 Evals
本地模型认知：最后补 Transformers / PyTorch，不用一开始就深挖训练

典型架构

最小可用架构

前端 (React/Next.js)
    ↓
Python FastAPI 接口层
    ↓
OpenAI SDK 调模型
    ↓
返回结果给前端

知识库架构

前端
    ↓
FastAPI
    ↓
文档解析 (Unstructured) → 切块 → Embedding → 向量数据库
    ↓
检索 → 重排 → 拼接上下文 → 模型回答

Agent 架构

前端
    ↓
FastAPI
    ↓
Agent Workflow (LangGraph / CrewAI / OpenAI Agents SDK)
    ↓
Tool Calling → 调用内部 API / 数据库 / 外部服务
    ↓
返回结构化结果

前端转 Python 大模型开发的落地方式

对前端背景的开发者，最现实的路线：

前端继续做：React / Next.js / UI 交互
Python 负责 AI 后端：FastAPI + Pydantic + OpenAI
有知识库时再加：Unstructured、embeddings、RAG 框架
需要多步工具调用时：langchain、langgraph 或 OpenAI Agents SDK
需要角色化协作时：crewai
真要碰本地模型时：Transformers / PyTorch

这样不是从零转行，而是在原有全栈能力上补出一条 Python AI backend 的主线。

关系与对比入口

javascript-vs-python-ai-libraries - JavaScript vs Python AI 库对比（选型参考）
ai-moc - AI 总入口 MOC
python-moc - Python 语言知识地图
fastapi - Python 高性能 Web API 框架

Python MOC

Python 大模型应用开发 MOC

这张地图覆盖什么

从这里开始

定位：Python 在大模型应用里做什么

技术栈分层

核心笔记

1. 服务层：把模型包成产品接口

2. 模型接入层：调模型 API

3. 数据与文档处理层（Python 的杀手锏）

4. RAG 层：带自己的数据

5. Agent 与工具调用层：让模型做事

6. 本地模型与训练层（可选，进阶）

7. 评测与追踪层

学习路线

典型架构

最小可用架构

知识库架构

Agent 架构

前端转 Python 大模型开发的落地方式

关系与对比入口

Related notes