AI MOC

AI 相关知识、工具、协议、应用和实践的总入口。

#tech / ai #type / moc #status / growing

AI MOC

人工智能相关知识、工具、协议、工作流与应用场景入口。

大语言模型

llm - 大语言模型基础
transformer - Transformer 架构核心概念
understanding-transformer-from-scratch - 从零理解 Transformer
transformers - Hugging Face Transformers 工具库

模型能力与模态

AI 模型能力 MOC - 按输入输出和任务形态组织模型能力
自动语音识别 ASR - 语音转文本
文本转语音 TTS - 文本转语音
光学字符识别 OCR - 图片和扫描件文字识别
Embedding 模型 - 语义向量化和检索召回
Hashing Embedding 降级 - 零模型下载的离线 embedding 方案
Reranker 模型 - 检索候选二次排序
意图感知 RAG 重排 - 按用户意图对检索结果做 boost 重排
RAG 知识库与 pgvector - PostgreSQL 向量检索的四层 schema
RAG Faithfulness 校验 - 治疗方案与知识库的一致性校验
视觉语言模型 VLM - 图像与文本联合理解
扩散模型 - 从噪声逐步生成图像等内容
openai-whisper - Whisper 语音识别模型

AI 工具与资源

claude-ai - Claude AI 助手
claude-code - Claude Code CLI 编程助手
Claude Code Workflow - Claude Code 内置多 Agent 编排引擎
Claude Code 多 Agent 编排模式 - Agent 工具 vs Workflow 选型
claude-usage-errors - Claude 使用报错问题记录
openai-codex - OpenAI Codex 编程助手
dify - 开源 AI 应用与 agentic workflow 平台
langsmith - LangChain 生态的 tracing、eval 和 monitoring 平台
qiniu-cloud-ai-api-usage - 七牛云 AI API 接入
ai-agent-config-file-path-reference - AI Agent 配置文件路径参考

AI 聊天助手

chatgpt - ChatGPT 网页 AI 聊天助手
google-gemini-website - Google Gemini 网页聊天
doubao-web-chat-tool - 豆包网页聊天工具（字节跳动）
google-ai-pro-benefits-tools-guide - Google AI Pro 权益工具详解
chat-with-you - ChatWithYou 仿真电话亭项目

AI 工具与协议

assistant-ui - React AI 聊天界面组件库（Radix 风格原语、多后端运行时）
function-calling - 函数调用
Function Calling 参数校验与重试机制 - 工具调用参数校验、repair 流程与高风险操作兜底
Function Calling 流式累积 - SSE 流中 tool_call 的增量拼接
Built-in tools - 宿主产品内置工具能力
mcp - Model Context Protocol
Augmented LLM - 把模型和检索、工具、记忆拼成基础执行构件
AI Agent Memory Layer - coding agent 的长期记忆层
Coding Agent Memory MOC - AI memory 主题入口
Skills 是什么，为什么重要
Matt Pocock Skills - 把真实工程习惯封装成可组合 skill 的代表性仓库
Matt Pocock Skills MOC - skill 本身与背后工程原理的入口
Matt Pocock Skills 的工程闭环 - 从 setup 到 triage 的工程闭环
Andrej Karpathy Skills - 用单一 skill 给 coding agent 加工程纪律的轻量仓库
Karpathy Guidelines Skill - Think Before Coding、Simplicity First、Surgical Changes、Goal-Driven Execution
Matt Pocock Skills 与 Karpathy Guidelines 的区别 - workflow library 与行为宪法的差异
docker-mcp-toolkit-moc - Docker MCP Toolkit（统一网关）
Orchestration - 多 agent 系统里的调度与控制层
多模型 LLM Provider 抽象层 - 统一管理多个大模型厂商接口差异
Manager (agents as tools) - manager 持续掌控、specialists 作为工具
Handoffs - 把 active agent 交给 specialist
a2a - Agent-to-Agent 协议
ai-ability-and-protocol - AI 能力来源与相关协议分层
postman-governance-catalog-workspaces-and-mcp - Postman 的组织级能力与 MCP 接入
v0-mcp - v0 MCP 前端视觉架构师
chrome-devtools-mcp - Chrome DevTools MCP
mcp-filesystem - MCP Filesystem 文件系统协议
mcp-client-configuration - MCP 客户端配置
docker-mcp-gateway - Docker MCP Gateway

Agentic Workflows

Agentic Systems - workflow 和 agent 的总框架
Agent 项目系统架构设计 - 分层架构蓝图与演进路径
Agentic Workflow Patterns - 常见 workflow pattern 的横向比较
Dify MOC - Dify 应用类型、Workflow / Chatflow 和实践入口
langchain - 通用 LLM / agent 应用开发框架
langgraph - stateful agent 和 workflow 的底层运行时
langsmith - tracing、debug、eval、monitoring 平台
crewai - 多智能体团队与 Flow 编排框架
LangChain、LangGraph 与 CrewAI 的定位对比 - 三者在控制层里的分工与选型
LangChain、LangGraph 与 LangSmith 的分层 - 从 Agent 系统架构看开发框架、运行时和观测层的分工
Prompt Chaining - 固定串行拆任务
LLM Task Routing - 先分类再分流
LLM Parallelization - sectioning 与 voting
Orchestrator-Workers - 动态拆解子任务再汇总
Evaluator-Optimizer - 生成与评审闭环
Agent-Computer Interface (ACI) - 工具接口设计与防错
Agent Guardrails - 风险控制、拦截和审批边界
Agent 中的人类监督 - 高风险节点的人类判断和升级机制
Agent 中的 Ground Truth Feedback - 测试、工具和环境反馈为何重要

AI 编程助手

jules - Google Jules 自主 AI 代码代理人
opencode - OpenCode 开源 AI 编程代理
spec-kit - Spec Kit 规格驱动 AI 开发工作流
github-copilot - GitHub Copilot
GitHub Copilot Memory - 仓库级记忆机制
copilot-usage-workflow - Copilot 使用技巧
copilot-cloud-agent - Cloud Agent
Claude Code Memory - 本地可审计的项目记忆
context7 - Context7 文档获取
letta - memory-first agent 系统
mem0 - 通用共享 memory backend
graphiti - 时序知识图谱式记忆层
langmem - LangGraph 生态的长期记忆层
Roo Code Memory Bank - 文件化 memory bank
agent-memory - 面向 coding agent 的独立 memory system
agent-tars - Agent TARS 多模态 Agent 工具
ai-assisted-frontend-development-workflow - AI 辅助前端开发工作流
ai-code-review-and-refactoring - AICR 与 AI 重构
AI 编码时代的 TDD - 把 TDD 当成 agent 的可执行规格与验收器
Vibe Coding 可能导致高级工程师断档的讨论 - 从 Vibe Coding、反馈回路、学习路径和组织激励看 AI 如何改变软件工程
Agent 测试与评估 - traces、datasets、graders、shadow 组成的 agent 质量体系
explain-like-iam-5 - 简化解释 prompt 片段

AI 代理

学习 AI Agent MOC - AI Agent 开发实战学习路径
Agent MOC - Agent 主题总入口
Agent - Agent 的核心定义与边界
ai-agent-creation - AI Agent 创建实践
Coding Agent MOC - coding agent 子主题入口
Agent Evals MOC - agent 评测与上线验证入口
Customer Support Agents - 客服 agent 的典型落地场景
Coding Agents - coding agent 的典型落地场景
bmad-method-moc - BMAD Method 入口

视频理解与多模态

视频素材理解管线 — 从视频上传到 AI 理解的完整管线
视频关键帧提取 — 从视频中提取代表性帧用于 AI 分析
Cloudflare Workers AI Vision — 用 Workers AI 视觉模型分析图片
pHash 图片去重 — 感知哈希判断图片相似度
FFmpeg 镜头检测 — 用 FFmpeg 检测视频镜头切换点
FFmpeg — 音视频处理工具集
Wrangler — Cloudflare Workers CLI

AI 应用与产品

BodySense 项目 MOC - AI 体态健康助手完整知识地图（35 篇笔记）
BodySense 项目概览 - AI 体态健康助手（React + Go + Python 三服务架构）
assistant-ui 概览 - React AI 聊天界面组件库（原语架构、多运行时、工具调用渲染）
AI 聊天 UI 设计 - AI 聊天界面的需求、选型与设计要点
多服务架构 - 前端/后端/AI 服务的职责边界与通信模式
OpenAI 兼容 LLM Provider - 多模型切换的统一抽象层
咨询 Agent 工作流 - 意图分类→动作决策→阶段推进的状态机
RAG 知识库与 pgvector - PostgreSQL 向量检索的四层 schema
Red Flag 症状检测器 - 危险症状的关键词模式匹配与安全预警
smart-summary-system - 智能摘要
deepseek-ocr - OCR 识别
umi-ocr - Umi-OCR 离线批量文字识别工具
notebooklm - Google NotebookLM AI 笔记与研究助手
hyprnote - AI 会议笔记产品方案
ai-module - AI 功能模块设计
frontend-leaning-fullstack-ai-agent-engineer - 全栈偏前端的 AI Agent 岗位画像与技能栈
ai-chat-page - AI 对话页面实现
ai-chat-and-streaming-ui - AI 对话与流式界面
SSE 流式输出的暂停与中断 - 流式对话中暂停/取消的状态同步与请求中断
AI 助手首字延迟优化 - 首字延迟全链路排查与优化
LLM Token 成本优化策略 - 模型路由、prompt 压缩与缓存降本

大模型部署

llm-deployment

Python 大模型应用开发

python-llm-application-development - Python 大模型应用开发技术栈、架构与学习路线

AI 技术选型与对比

javascript-vs-python-ai-libraries - JavaScript vs Python AI 库对比

AI MOC

大语言模型

模型能力与模态

AI 工具与资源

AI 聊天助手

AI 工具与协议

Agentic Workflows

AI 编程助手

AI 代理

视频理解与多模态

AI 应用与产品

大模型部署

Python 大模型应用开发

AI 技术选型与对比

相关 MOC

Related notes