AI MOC
AI 相关知识、工具、协议、应用和实践的总入口。
#tech / ai
#type / moc
#status / growing
AI MOC
人工智能相关知识、工具、协议、工作流与应用场景入口。
大语言模型
- llm - 大语言模型基础
- transformer - Transformer 架构核心概念
- understanding-transformer-from-scratch - 从零理解 Transformer
- transformers - Hugging Face Transformers 工具库
模型能力与模态
- AI 模型能力 MOC - 按输入输出和任务形态组织模型能力
- 自动语音识别 ASR - 语音转文本
- 文本转语音 TTS - 文本转语音
- 光学字符识别 OCR - 图片和扫描件文字识别
- Embedding 模型 - 语义向量化和检索召回
- Hashing Embedding 降级 - 零模型下载的离线 embedding 方案
- Reranker 模型 - 检索候选二次排序
- 意图感知 RAG 重排 - 按用户意图对检索结果做 boost 重排
- RAG 知识库与 pgvector - PostgreSQL 向量检索的四层 schema
- RAG Faithfulness 校验 - 治疗方案与知识库的一致性校验
- 视觉语言模型 VLM - 图像与文本联合理解
- 扩散模型 - 从噪声逐步生成图像等内容
- openai-whisper - Whisper 语音识别模型
AI 工具与资源
- claude-ai - Claude AI 助手
- claude-code - Claude Code CLI 编程助手
- Claude Code Workflow - Claude Code 内置多 Agent 编排引擎
- Claude Code 多 Agent 编排模式 - Agent 工具 vs Workflow 选型
- claude-usage-errors - Claude 使用报错问题记录
- openai-codex - OpenAI Codex 编程助手
- dify - 开源 AI 应用与 agentic workflow 平台
- langsmith - LangChain 生态的 tracing、eval 和 monitoring 平台
- qiniu-cloud-ai-api-usage - 七牛云 AI API 接入
- ai-agent-config-file-path-reference - AI Agent 配置文件路径参考
AI 聊天助手
- chatgpt - ChatGPT 网页 AI 聊天助手
- google-gemini-website - Google Gemini 网页聊天
- doubao-web-chat-tool - 豆包网页聊天工具(字节跳动)
- google-ai-pro-benefits-tools-guide - Google AI Pro 权益工具详解
- chat-with-you - ChatWithYou 仿真电话亭项目
AI 工具与协议
- assistant-ui - React AI 聊天界面组件库(Radix 风格原语、多后端运行时)
- function-calling - 函数调用
- Function Calling 参数校验与重试机制 - 工具调用参数校验、repair 流程与高风险操作兜底
- Function Calling 流式累积 - SSE 流中 tool_call 的增量拼接
- Built-in tools - 宿主产品内置工具能力
- mcp - Model Context Protocol
- Augmented LLM - 把模型和检索、工具、记忆拼成基础执行构件
- AI Agent Memory Layer - coding agent 的长期记忆层
- Coding Agent Memory MOC - AI memory 主题入口
- Skills 是什么,为什么重要
- Matt Pocock Skills - 把真实工程习惯封装成可组合 skill 的代表性仓库
- Matt Pocock Skills MOC - skill 本身与背后工程原理的入口
- Matt Pocock Skills 的工程闭环 - 从 setup 到 triage 的工程闭环
- Andrej Karpathy Skills - 用单一 skill 给 coding agent 加工程纪律的轻量仓库
- Karpathy Guidelines Skill - Think Before Coding、Simplicity First、Surgical Changes、Goal-Driven Execution
- Matt Pocock Skills 与 Karpathy Guidelines 的区别 - workflow library 与行为宪法的差异
- docker-mcp-toolkit-moc - Docker MCP Toolkit(统一网关)
- Orchestration - 多 agent 系统里的调度与控制层
- 多模型 LLM Provider 抽象层 - 统一管理多个大模型厂商接口差异
- Manager (agents as tools) - manager 持续掌控、specialists 作为工具
- Handoffs - 把 active agent 交给 specialist
- a2a - Agent-to-Agent 协议
- ai-ability-and-protocol - AI 能力来源与相关协议分层
- postman-governance-catalog-workspaces-and-mcp - Postman 的组织级能力与 MCP 接入
- v0-mcp - v0 MCP 前端视觉架构师
- chrome-devtools-mcp - Chrome DevTools MCP
- mcp-filesystem - MCP Filesystem 文件系统协议
- mcp-client-configuration - MCP 客户端配置
- docker-mcp-gateway - Docker MCP Gateway
Agentic Workflows
- Agentic Systems - workflow 和 agent 的总框架
- Agent 项目系统架构设计 - 分层架构蓝图与演进路径
- Agentic Workflow Patterns - 常见 workflow pattern 的横向比较
- Dify MOC - Dify 应用类型、Workflow / Chatflow 和实践入口
- langchain - 通用 LLM / agent 应用开发框架
- langgraph - stateful agent 和 workflow 的底层运行时
- langsmith - tracing、debug、eval、monitoring 平台
- crewai - 多智能体团队与 Flow 编排框架
- LangChain、LangGraph 与 CrewAI 的定位对比 - 三者在控制层里的分工与选型
- LangChain、LangGraph 与 LangSmith 的分层 - 从 Agent 系统架构看开发框架、运行时和观测层的分工
- Prompt Chaining - 固定串行拆任务
- LLM Task Routing - 先分类再分流
- LLM Parallelization - sectioning 与 voting
- Orchestrator-Workers - 动态拆解子任务再汇总
- Evaluator-Optimizer - 生成与评审闭环
- Agent-Computer Interface (ACI) - 工具接口设计与防错
- Agent Guardrails - 风险控制、拦截和审批边界
- Agent 中的人类监督 - 高风险节点的人类判断和升级机制
- Agent 中的 Ground Truth Feedback - 测试、工具和环境反馈为何重要
AI 编程助手
- jules - Google Jules 自主 AI 代码代理人
- opencode - OpenCode 开源 AI 编程代理
- spec-kit - Spec Kit 规格驱动 AI 开发工作流
- github-copilot - GitHub Copilot
- GitHub Copilot Memory - 仓库级记忆机制
- copilot-usage-workflow - Copilot 使用技巧
- copilot-cloud-agent - Cloud Agent
- Claude Code Memory - 本地可审计的项目记忆
- context7 - Context7 文档获取
- letta - memory-first agent 系统
- mem0 - 通用共享 memory backend
- graphiti - 时序知识图谱式记忆层
- langmem - LangGraph 生态的长期记忆层
- Roo Code Memory Bank - 文件化 memory bank
- agent-memory - 面向 coding agent 的独立 memory system
- agent-tars - Agent TARS 多模态 Agent 工具
- ai-assisted-frontend-development-workflow - AI 辅助前端开发工作流
- ai-code-review-and-refactoring - AICR 与 AI 重构
- AI 编码时代的 TDD - 把 TDD 当成 agent 的可执行规格与验收器
- Vibe Coding 可能导致高级工程师断档的讨论 - 从 Vibe Coding、反馈回路、学习路径和组织激励看 AI 如何改变软件工程
- Agent 测试与评估 - traces、datasets、graders、shadow 组成的 agent 质量体系
- explain-like-iam-5 - 简化解释 prompt 片段
AI 代理
- 学习 AI Agent MOC - AI Agent 开发实战学习路径
- Agent MOC - Agent 主题总入口
- Agent - Agent 的核心定义与边界
- ai-agent-creation - AI Agent 创建实践
- Coding Agent MOC - coding agent 子主题入口
- Agent Evals MOC - agent 评测与上线验证入口
- Customer Support Agents - 客服 agent 的典型落地场景
- Coding Agents - coding agent 的典型落地场景
- bmad-method-moc - BMAD Method 入口
视频理解与多模态
- 视频素材理解管线 — 从视频上传到 AI 理解的完整管线
- 视频关键帧提取 — 从视频中提取代表性帧用于 AI 分析
- Cloudflare Workers AI Vision — 用 Workers AI 视觉模型分析图片
- pHash 图片去重 — 感知哈希判断图片相似度
- FFmpeg 镜头检测 — 用 FFmpeg 检测视频镜头切换点
- FFmpeg — 音视频处理工具集
- Wrangler — Cloudflare Workers CLI
AI 应用与产品
- BodySense 项目 MOC - AI 体态健康助手完整知识地图(35 篇笔记)
- BodySense 项目概览 - AI 体态健康助手(React + Go + Python 三服务架构)
- assistant-ui 概览 - React AI 聊天界面组件库(原语架构、多运行时、工具调用渲染)
- AI 聊天 UI 设计 - AI 聊天界面的需求、选型与设计要点
- 多服务架构 - 前端/后端/AI 服务的职责边界与通信模式
- OpenAI 兼容 LLM Provider - 多模型切换的统一抽象层
- 咨询 Agent 工作流 - 意图分类→动作决策→阶段推进的状态机
- RAG 知识库与 pgvector - PostgreSQL 向量检索的四层 schema
- Red Flag 症状检测器 - 危险症状的关键词模式匹配与安全预警
- smart-summary-system - 智能摘要
- deepseek-ocr - OCR 识别
- umi-ocr - Umi-OCR 离线批量文字识别工具
- notebooklm - Google NotebookLM AI 笔记与研究助手
- hyprnote - AI 会议笔记产品方案
- ai-module - AI 功能模块设计
- frontend-leaning-fullstack-ai-agent-engineer - 全栈偏前端的 AI Agent 岗位画像与技能栈
- ai-chat-page - AI 对话页面实现
- ai-chat-and-streaming-ui - AI 对话与流式界面
- SSE 流式输出的暂停与中断 - 流式对话中暂停/取消的状态同步与请求中断
- AI 助手首字延迟优化 - 首字延迟全链路排查与优化
- LLM Token 成本优化策略 - 模型路由、prompt 压缩与缓存降本
大模型部署
Python 大模型应用开发
- python-llm-application-development - Python 大模型应用开发技术栈、架构与学习路线
AI 技术选型与对比
- javascript-vs-python-ai-libraries - JavaScript vs Python AI 库对比
相关 MOC
- frontend-engineering-moc - 前端工程化与 AI 工程化
- daily-use-moc - DailyUse 项目实践