@snowboat84: https://x.com/snowboat84/status/2072106695040565615

X AI KOLs Timeline 新闻

摘要

这篇文章详细介绍了MCP(模型上下文协议)的起源、发展以及它如何解决AI模型与现实世界工具连接的问题,回顾了其在短短十二个月内被包括竞争对手在内的全行业广泛采纳的过程。

https://t.co/3DtHMKXi3O
查看原文
查看缓存全文

缓存时间: 2026/07/01 14:08

什么是 MCP ?长篇科普

引子

这两年,MCP这三个字母在AI圈里被反复提起,开口闭口都是它。可它到底是什么,多数人未必说得清。

先把镜头往回拉两年。那时候的大语言模型,说句不客气的,像个博学的瞎子。它读过的书堆成山,引经据典张口就来,可它的知识停在训练完成那一刻,你问它今天的新闻、此刻的股价,它一概不知道。你让它替你办点事,订张票、查个数据、改份文档,它更是使不上劲,只能在对话框里跟你干聊。聪明绝顶,却什么也碰不到。

再看今天。同一类模型,已经能联网查到实时信息,能读你刚共享给它的文件,能调用一连串工具替你跑腿,能自己一步步把一件正事办完。短短两年,它从一个被困在对话框里的大脑,变成了一个能把手伸进真实世界去干活的助手。

这中间到底发生了什么,让一个瞎子睁开了眼、又长出了手?原因不止一个,但其中最关键的一块拼图,名字就叫MCP,全称Model Context Protocol,模型上下文协议。注意是MCP,不是MPC,后者是另一回事。

这篇文章讲的就是这件事:模型怎么从“只会说“变成“能动手“,MCP在这场转变里到底起了什么作用,以及为什么这套看着不起眼的协议,2024年底才出现,一年多就铺遍整个行业,连最大的竞争对手都主动用上了它。说到底,它解决的是一个在计算机史上反复出现、每次都很难、一旦解决就引爆一波增长的老问题。我们慢慢说。

一、MCP从哪来:一个协议的十二个月

这一章只讲故事,讲MCP是在什么背景下冒出来的,怎么在一年里从一家公司的内部规范变成全行业的地基。它具体怎么工作,留到第二章。

1.1 AI的转向:从“会聊天“到“想干活“

2022年底ChatGPT火起来的时候,大家对AI的期待还很简单:你问它答,它是个超级搜索引擎加超级作文老师。它待在对话框里,吐出来的是文字,你拿这些文字自己去用。

到了2023、2024年,风向变了。人们不再满足于让AI“说“,开始想让它“做“。帮我订机票,帮我查一下这个月的销售数据,帮我把这段代码提交上去,帮我整理收件箱。这种“替你办事“的助手,业内叫它agent,智能体。

一旦从“说“变成“做“,一个老毛病立刻变得不能忍。模型再聪明,默认也够不到你此刻的日历、你公司的数据库、你正在写的文档。就算它能上网查公开信息,你私有的那些系统它照样进不去。你让它办事,它得先能够到这些东西,够不到,再聪明也是空转。

打个比方,这就像你雇了个智商极高的秘书,被锁在一间隔音玻璃房里。他能隔着玻璃看报、看电视,对外面的世界门儿清,可你桌上的文件他一份也拿不到,你的电话他也碰不着。聊天的年代这不碍事,办事的年代,这道玻璃就是最大的障碍。

为什么这堵墙一直都在,却到2024年才成了人人喊打的痛点?因为在“聊天“的年代它根本不碍事。你让AI写首诗、解道题、翻译一段话,它靠脑子里那点训练知识就够了,连不连外部系统无所谓。可一旦目标换成“替你把事办成“,墙后面那些东西,你的真实数据、能动手的工具,就从可有可无变成了非有不可。同一堵墙,需求一变,地位天差地别。这也是为什么MCP来得不早不晚,恰好踩在这个节点上。

1.2 协议的诞生:Anthropic出手

2024年11月25日,做出Claude的公司Anthropic推出并开源了MCP,一套让AI应用跟外部工具、数据打交道的标准。开源的意思是,规范公开,谁都能看、能用、能照着实现,不收费、不设门槛。

Anthropic没有只甩出一份文档了事。发布当天就配齐了配套的开发工具包SDK,还附带了一批做好的连接器,能直接接上Google Drive、Slack、GitHub、Postgres数据库这些常用系统。换句话说,它一上来就把“怎么用“也准备好了,降低了所有人上手的成本。

这里有个值得留意的选择:开放。Anthropic完全可以把MCP做成只有Claude能用的私有接口,用它来绑住自己的用户。它没有这么做,而是把规范彻底公开,邀请所有人,包括竞争对手,一起用同一套标准。这个决定看着像是把自家的优势让了出去,后文会看到,它恰恰是MCP能赢的关键一步,这条线先埋在这里。

发布当天就有一批公司接了进来,Block、Apollo这样的企业,还有Zed、Replit、Sourcegraph这些做开发工具的团队,都成了第一批用户。一个新协议,刚出生就有人抱着用,这是个好兆头。

顺带说清楚开源对一个标准到底意味着什么。它不只是“代码免费看“,更是把这套规矩的解释权摊开放在桌面上:任何人都能照着实现自己的客户端和服务端,不必经过Anthropic点头,也不用担心哪天被收费、被锁死。对一个想当行业通用语的东西来说,这种“谁都能用、谁也改不动别人“的开放性,比任何营销都管用。它等于先把信任问题解决了,剩下的才是技术好不好用。

1.3 十二个月的奇迹:连对手都用上了

这一章真正的高潮在这里。一般来说,一个技术标准要在全行业普及,得花好几年,甚至十几年。互联网的很多底层协议都是磨了一代人才铺开的。MCP不一样,它大约只用了十二个月。

2025年3月26日,最关键的一脚落地:OpenAI正式采纳了MCP。OpenAI是Anthropic最直接、最大的竞争对手,ChatGPT就是它的产品。这天OpenAI的CEO山姆·奥特曼(Sam Altman)在X上公开表态,说大家都很喜欢MCP,他们要在自家产品里支持它,并且当天就在OpenAI的Agents SDK里上线了MCP支持,ChatGPT桌面端和Responses API的支持随后跟上。

这件事的分量在于:这不是Anthropic花钱买来的合作,也不是行业协会硬性摊派的标准。是竞争对手自己看明白了,主动用上了对家定的规矩。一个标准能让死对头心甘情愿地采用,这是它从“某家厂商的私货“变成“真正的行业标准“的最强信号。

紧接着是连锁反应。2025年4月,Google DeepMind的负责人Demis Hassabis确认,Gemini模型也会支持MCP。同年5月的微软Build大会上,微软和GitHub也宣布支持MCP,并把它接进开发者生态。到2025年底,主流的AI客户端,ChatGPT、Claude、Gemini、微软Copilot、Cursor、VS Code,几乎全都原生支持MCP。短短一年,它从一家公司的提案,变成了主流AI客户端和开发者工具默认接受的通用接口。

对照那些没能普及的标准,更能看出门道。工程史上不乏技术上更完备、却始终火不起来的协议,败因往往是它绑死在某一家厂商身上,别人用着不放心。MCP走的是反过来的路:先把规范彻底交出去,让所有人都没有后顾之忧,再靠这份安全感去换铺天盖地的采用。竞争对手肯主动用上对家定的规矩,本身就是这套打法奏效的最硬证据,任何广告都换不来这种背书。

1.4 交给社区:从一家公司到行业基础设施

故事还有最后一步。2025年12月9日,Anthropic把MCP捐了出去,交给Linux基金会下面一个新成立的组织,叫Agentic AI Foundation,智能体AI基金会。

这是个由Linux基金会托管的专项基金,发起方除了Anthropic,还有Block和OpenAI,背后支持的有Google、微软、AWS、Cloudflare、彭博这些大公司。一同被捐进去的还有Block的goose项目和OpenAI的AGENTS.md规范,MCP是其中分量最重的一块。Anthropic特意说明,MCP原有的、由维护者主导的治理方式不变,捐赠改的是归属,不是日常怎么运转。

为什么一家公司要把自己一手做出来、又火遍全行业的东西拱手送人?因为对一个想当“标准“的东西来说,被某一家公司攥在手里,本身就是它最大的软肋。只要它还姓Anthropic,竞争对手用着就总有一层顾虑:哪天你改规则、卡我脖子怎么办。把它交给中立的基金会,等于昭告天下:这是大家的水电煤,不是谁的私产。这一步,让前面1.2节埋下的“开放“叙事走到了终点。

这种“做大了就交给中立基金会“的剧本,开源世界里有现成先例。Google把容器编排系统Kubernetes捐给云原生计算基金会CNCF之后,Kubernetes反而坐稳了行业标准的位置,所有云厂商都放心拿去用。Linux基金会这些年扮演的就是这样一个中立托管人,把一项项关键技术从某家公司的私产,转成全行业的公共设施。MCP进入Agentic AI Foundation,走的是同一条被验证过的路。

讲到这里,一个问题已经按捺不住了:它凭什么这么快就成了?一个标准能在十二个月里让所有对手低头,这在历史上极其少见。答案不在这一章,要等我们把它到底是什么、它的前辈都是谁讲清楚之后,第四章再来揭晓。

二、MCP到底在干什么

上一章讲了MCP的来龙去脉,这一章把它本身讲清楚。规矩只有一条:每个黑话词后面都配一个生活里的比喻,绝不连着甩两个术语砸你。读完这一章,你应该能用一句话跟朋友解释MCP是什么。

2.1 那个真正的麻烦:N×M问题

先说清楚MCP到底在解决什么麻烦,否则后面全是空中楼阁。这个麻烦有个朴素的名字,叫N×M问题。

设想现在市面上有10个AI应用,比如Claude桌面端、Cursor,还有形形色色的AI助手。这里要先分清楚一件事:GPT、Claude、Gemini这些是基础模型,是脑子,而真正去对接你工具的,是包在模型外面、你直接打交道的那层应用。另一边,有100个工具和数据源等着被接进去,你的日历、你的数据库、你公司的客服系统、GitHub。在MCP出现之前,每一个AI应用要用上每一个工具,都得有人专门写一段对接代码,俗称连接器。10个应用,每个都要单独接100个工具,最坏情况下就是10乘100,一千套连接器。

更糟的是这些连接器互不通用。给一个应用写的那一套,换到另一个应用就用不了,得重写。今天接好了你的CRM,明天换个应用,前功尽弃。开发者被困在一张乱成一团的连线网里,绝大部分精力花在“接上“这件毫无创造性的苦力活上。

举个具体点的画面。一个工程师想让公司的AI助手能查内部的客户管理系统CRM,过去他得为这一个应用专门写一套定制插件,调通、测试、维护,往往是好几天到一两周的活。换一个应用,整件事重来一遍。这种重复劳动,乘以全行业成千上万家公司,是一笔惊人的浪费。

MCP的核心价值,一句话就能讲明白:它把这张乱网捋直了。原来要写N乘M套连接器,现在变成N加M。每个AI应用只要学会说MCP这一种“普通话“,每个工具只要按MCP的规矩把自己包装一次,两边就能按同一套流程发现、描述和调用。那个工程师写一次MCP server,所有支持MCP的AI应用和客户端就都能接上他的CRM,再也不用一个客户端一套。

这里得说清楚“最坏情况“那个词。现实里当然不是每个应用都要接上每一个工具,但只要对接是定制的、不通用的,整个生态的总成本就随着应用数和工具数相乘地往上涨。任何一方多出一个新成员,理论上就要新增一整排连接器去配它。这种平方级别的负担,才是N×M问题真正吓人的地方:接某一个工具本身不算什么,可整个行业的对接成本被锁死在一条注定越走越重的曲线上,谁都甩不掉。MCP做的事,是把这条曲线从相乘掰成了相加,这是量级上的差别。

2.2 一个比喻:AI的USB-C接口

如果上面那段还是有点抽象,Anthropic自己给了一个特别贴切的比喻,官方文档里的原话是:把MCP想象成AI应用的USB-C接口。

回想USB-C出现之前是什么光景。手机、相机、硬盘、耳机,每种设备都有自己的插口和专用线,出门得带一大把充电器,丢一根配一根还得对型号。USB-C统一了接口之后,一根线插遍所有设备,谁也不用记自己那台是什么口。

MCP想做的就是AI世界的这根USB-C。任何遵守这套标准的AI应用,叫它宿主,都能插上任何遵守标准的工具,叫它服务端,插上就能用,自动认出对方有哪些能力,不必为每一种组合单独写代码。一个统一的口子,锁住了这一整章的逻辑。

这个比喻好就好在它顺手点出了标准的本质:标准不创造新能力,它消灭重复劳动。USB-C没让你的硬盘跑得更快,它只是让你不用再为接口发愁。MCP也一样,它不让模型变聪明,它让模型够得着东西这件事,从一桩苦差变成理所当然。

USB-C这个比喻还藏着一层值得留意的历史。当年接口五花八门,根子不在厂商笨,而在各家都想用自己的私有接口绑住用户,顺带卖专用配件。统一接口能不能落地,关键在大家愿不愿意放下“绑住用户“的小算盘,接受一个谁都能用的公共标准,技术难度反倒是次要的。MCP面对的是同一道坎,而它最不寻常之处,恰恰是几家最该互相设防的AI公司,这一次选择了共用一个口子。

2.3 MCP怎么工作:宿主、客户端、服务端

把比喻拆开看内部,MCP其实是三个角色在配合。用拟人的方式讲最清楚。

第一个角色是宿主(host),就是你直接打交道的那个AI应用,Claude桌面端、Cursor都是。你可以把它想成一位项目经理,听你下指令,负责调度,但它本人不亲自跑腿。

第二个角色是客户端(client),住在宿主体内,是宿主派出去的联络员。每要对接一个外部工具,宿主就派一个专属客户端去跟那个工具单线联系,一对一,互不串线。它就像项目经理身边的助理,专门负责跟某一个外部供应商对接。

第三个角色是服务端(server),是工具或数据源那一头的代表。你的Google日历有一个MCP服务端,你公司的数据库有一个,GitHub有一个。每个服务端的活儿,是用大白话把自己能干的事报清楚:我这儿能查日历、能加日程、能删会议。它像是供应商派来的接待员,专门告诉来访者“我们家提供哪些服务“。

所谓“协议“,听着唬人,剥开就是这三方事先约好的一套对话规矩:联络员该怎么问,接待员该用什么格式答,项目经理拿到答复怎么往下传。规矩统一了,任意一个宿主和任意一个服务端,哪怕从没见过面,也能当场聊起来。

讲细一点,服务端报给模型的能力不止“工具“一种。MCP把一个服务端能提供的东西分成几类:可以被模型主动调用的“工具“(tools),比如发邮件、查数据库。可以被读取的“资源“(resources),比如一份文档、一段日志。还有预设好的“提示模板“(prompts),帮模型把一类常见任务一步到位。这些术语你不用记,只要知道服务端不只是一排“能干活的按钮“,它还能把“可读的资料“和“现成的套路“一起递过去。

这套三方分工里有个设计上的讲究:客户端和服务端严格一对一。宿主想接十个工具,就在体内派出十个互不知情的客户端,各管各的。这么做是为了隔离,你连上的某个工具出了岔子,乱不到其它工具头上。后面讲安全时会看到,这层隔离很有用,却挡不住所有花招。

2.4 走一遍流程:AI帮你查销售额

光看角色还是干,我们让这三方实际跑一趟。场景:你跟AI助手说,帮我查一下上个月的销售额。

第一步,认门。宿主先让客户端去问公司数据库的服务端:你都能干啥?服务端用大白话回一份清单:我能按月份查销售额,能按地区拆分,能导出明细。注意这一步全是自然语言描述,模型靠读这份描述就知道有哪些工具、每个工具要喂什么参数。

第二步,下单。模型一看,“按月份查销售额“正好对得上你的需求,于是让客户端去调用这个工具,把参数“上个月“递过去。这一步是模型自己判断该用哪个工具,不需要你手动指。

第三步,回填。服务端真的去数据库里跑了一趟,把数字捞回来,原路传回给模型。模型拿到上个月的销售额,再用人话组织成一句回答给你:上个月销售额是多少,比前月涨了多少。

整趟下来你只说了一句话,背后宿主、客户端、服务端来回跑了好几轮。关键在于,这套流程对任何工具都一个样。今天查销售额,明天发邮件、改日程、提交代码,换的只是服务端,规矩不变。到这儿,你应该能一句话向朋友解释MCP了:它是一套统一的规矩,让AI助手能自动发现并使用外部的工具和数据,不用人为每个工具单独写对接。

再补一个现实里绕不开的环节:出错怎么办。真实世界里数据库可能连不上,权限可能不够,模型也可能挑错工具。MCP的流程允许服务端把“这次没成功、原因是什么“原样回报给模型,模型据此换个工具重试,或者老实告诉你“这件事我没做成,因为没权限“。这正是装上手脚之后最关键的一点:办得成就真办成,办不成的时候,它会告诉你卡在哪儿,而不是含糊糊弄过去。

也正因为每个动作都真的落到了外部系统上,这套机制比单纯聊天危险得多。聊天最多是话说错,办事却可能把不该删的日程删了、把不该发的邮件发出去。能力和风险是同一枚硬币的两面,这一层留到第五章细说。

三、这个形状,其实早就有了

MCP听着新,可它的“形状“在工程史上一点都不新。这一章由近及远排一排它的前辈,你会发现,“用一个通用标准把混乱的多对多接成简单的多加多”,是个反复上演的老套路。看懂这一点,第四章给它定位才有坐标。

3.1 最直接的祖先:LSP

要找MCP血缘最近的祖先,是LSP,语言服务器协议(Language Server Protocol)。这个类比性价比最高,值得多讲两句。

LSP解决的问题,跟MCP几乎是一个模子刻出来的,只是发生在另一个领域:代码编辑器。程序员用的编辑器有很多,VS Code、Vim、各种IDE。编程语言也有很多,Python、Go、Rust。每个编辑器要想聪明地支持每种语言,自动补全、语法报错、跳转定义,过去都得单独写一套。M个编辑器乘N种语言,又是那张要写M乘N套的乱网,跟2.1节的N×M一模一样。

2016年6月,微软联合Red Hat和Codenvy把LSP标准化,把这件事捋直了。语言那头只要实现一个“语言服务器“,编辑器这头只要会说LSP,两边就能对上。N乘M瞬间塌缩成N加M,每个编辑器写一次,每种语言写一次,完事。

MCP跟LSP的关系是实打实的借鉴,连血缘都对得上。MCP的设计直接复用了LSP的消息流思路,两者底层都用同一种叫JSON-RPC 2.0的消息格式来收发请求。可以说,Anthropic把LSP在“编辑器×语言“上验证过、跑通了快十年的那套办法,原样搬到了“AI应用×工具“上。前辈趟过的路,后来者照着走,省了无数试错。

LSP还留下一条经验,正好被MCP继承:让标准只管“怎么对话“,不管“具体能力是什么“。LSP从不规定某种语言该有哪些功能,它只规定编辑器和语言服务器之间用什么格式收发消息,补全、报错、跳转这些能力由各语言自己实现。MCP一模一样,它不替任何工具决定该提供什么功能,只定下三方交换信息的规矩。这种“只管通信、不管内容“的克制,是这类协议能被广泛复用的关键,管得越少,上面能装的东西越多。

3.2 同代近亲:函数调用与ChatGPT插件

再近一点的亲戚,是OpenAI自己在2023年搞的两样东西。它们想解决的问题跟MCP重叠,但走了另一条路,结果成了反面教材。

一个是函数调用(function calling),2023年6月上线,让开发者能把外部函数描述给模型,模型判断该调哪个、传什么参数。另一个是ChatGPT插件,2023年3月发布,想做成一个“AI应用商店“,让第三方把服务做成插件挂到ChatGPT上,查机票、订餐、搜论文。

方向是对的,毛病出在封闭。函数调用和插件都是OpenAI专属的,你为ChatGPT做的插件,Claude用不了,Gemini也用不了,每接一个新模型就得重做一遍。插件这条路更不顺,热闹了没多久就冷下去,OpenAI在2024年3月19日停掉了新的插件会话,4月9日彻底关停,用功能更宽泛的Custom GPTs接了班。

这段对照很有教育意义。一个封闭的、绑死单一厂商的应用商店,最后败给了一个开放的、谁都能实现的协议。同样想给AI接上外部世界,押注“只有我能用“的那条路走不远,押注“大家一起用“的那条路活了下来。这正是1.2节那个“开放“选择的价值,在历史里照出了影子。

ChatGPT插件那段短命史尤其值得当镜子。它2023年3月发布时被寄予厚望,号称要做AI时代的应用商店,结果不到一年就熄火。除了封闭,毛病还不止一个:开发者得专门为它适配,用户得手动一个个去装、去开,体验割裂。它能接什么、能触达多少人,全卡在OpenAI一家的节奏里。后来接班的Custom GPTs换了形态,“只在我家生态里玩“的内核没变。MCP把这件事彻底反过来:协议公开,谁都能做服务端,谁的模型都能用,发现和调用还交给模型自动完成。同一件事,开放的做法走通了,封闭的做法没走通。

3.3 更老的工程史:程序如何对话

把镜头再往前拉,让两个程序隔着网络对话,是计算机界折腾了三十年的老题目。MCP站在一长串前辈的肩膀上。

最早是RPC,远程过程调用,让一台机器上的程序像调用本地函数一样去调另一台机器上的功能。后来到了2000年前后,出现了SOAP和WSDL这一套企业级标准,想法很宏大,要把所有跨系统通信都规范死。围着SOAP还长出一大家子以WS打头的规范,WS-Security管安全、WS-Addressing管寻址、WS-ReliableMessaging管可靠传输,名字一长串,业内索性统称它们WS星号系列(写出来就是WS后面跟个星号通配符,代指这一整串后缀)。结果这套东西规范得过了头,叠床架屋,光配置文件就能看晕人,又重又难用,成了“过度设计“的经典教案。

物极必反,接着流行起来的REST走了相反的极简路线,配上OpenAPI来描述接口长什么样,轻便、好懂,成了今天网络服务的主流。MCP常被类比成“AI时代的OpenAPI“,两者都是用一份标准说明书告诉对方“我有哪些能力、该怎么调“。区别在于,OpenAPI主要写给人和程序看,MCP是专门写给AI模型读的。

这条几十年的脉络里,藏着一个来回摆动的钟摆,在“管得太松“和“管得太死“之间晃。RPC和早期方案偏松,各搞各的,互通性差。SOAP和WS那一代矫枉过正,把规矩定到密不透风,重得没人愿意用。REST又荡回简单那头,靠几条朴素约定赢下了整个互联网。每一代工程师,都得在这两个极端之间重新找平衡点。

MCP站在这根钟摆的最新位置上,选择很清楚:宁可简单到看着不够“严谨“,也不复杂到吓退开发者。它躲开了WS那种大而全的覆辙,学REST那种“够用就好“的克制。一个标准能不能活,多数时候看的是上手有多容易,至于考虑得周不周全,还在其次。历史一再证明,这道选择题上活下来的,几乎总是更简单的那个。

3.4 最有画面感的:日常里的标准

最后跳出软件,看看身边。“用一个通用标准接通一堆互不相容的东西”,这个套路在物理世界里到处都是,而且每一次都深刻改变了一个行业。

USB,统一了电脑外设的接口,U盘、鼠标、键盘插上就用,不用再装一堆专用驱动。设备驱动程序,让操作系统不必为每一款打印机单独写代码,认一个通用接口就行。集装箱,把尺寸统一成标准箱,货轮、卡车、吊车、火车全按这个尺寸来,全球物流成本应声而降。还有铁路轨距,所有铁轨宽度统一,一列火车才能从这国开到那国。

这些东西平时你根本不会想起,可一旦没有它们,整个世界都会卡住。它们共同指向一条很深的规律:通用适配器是个反复出现的老模式。每当一个领域里“东西越来越多、互相又对不上“的矛盾积累到临界点,就会有一个统一的标准冒出来,把混乱压成秩序,然后引爆一波此前被对接成本压住的增长。MCP,就是这个老模式在AI时代的最新一例。

再细看这些日常标准,它们的回报方式也惊人地一致:短期看是省了对接的麻烦,长期看是催生了原本不存在的新生意。集装箱标准化之后,省下的不只是装卸费,它直接让全球供应链、远洋贸易、跨国制造成为可能,把整个世界的经济地图重画了一遍。USB普及之后,冒出来一大批靠这个统一接口才活得下去的小硬件厂商。统一标准真正的威力,从来不在省下的那点钱,而在它解锁的那片此前根本无法存在的新空间。记住这一点,第四章掂量MCP的分量时用得上。

四、MCP算老几

第三章把前辈排了一排,这一章给MCP定位:它在这串家谱里到底算老几,又凭什么能这么快成功。先解上一章留下的谜,再把它放进那个上百年的大模式里掂量分量。

4.1 解谜:MCP凭什么这么快成功

回到第一章末尾按下的那个问题:一个协议怎么能在十二个月里让所有竞争对手都低头?答案是三件事凑在了一起,缺一不可。

第一件,开放。Anthropic从一开始就把MCP彻底公开、免费、不绑自家产品,后来更是直接捐给中立基金会。这一步拆掉了竞争对手采用它的全部顾虑。试想,如果MCP只有Claude能用,OpenAI绝不可能在2025年3月主动接它,它顶多是Anthropic的一个内部特性,火不出自己的院子。

第二件,简单。它学的是LSP和REST那条克制的路,没走WS那种大而全的老路。底层复用成熟的JSON-RPC,工具描述用大白话,开发者花一两个小时就能跑通一个server。一个标准上手越容易,扩散就越快,这是被无数前辈反复验证过的铁律。

第三件,时间点。MCP出现在2024年底,正好踩在AI从“会聊天“转向“想干活“的浪尖上。早两年,模型还在对话框里待着,根本没人迫切需要这么一套对接标准,再好的协议也无人问津。晚两年,各家可能已经各自造了一堆互不兼容的轮子,再想统一就难了。它来得不早不晚,恰好是整个行业最需要它的那一刻。开放给了它被接受的资格,简单给了它扩散的速度,时间点给了它爆发的需求,三者叠加,才有这场十二个月的奇迹。

三件事缺一不可,这点值得停一下。光开放不够,一个开放却难用的协议,没人愿意花力气接。光简单不够,一个简单却绑死单家的接口,对手再喜欢也不敢碰。光踩中时间点更不够,需求来了而东西又难用又封闭,照样被别的方案抢走。MCP的运气在于这三样恰好同时到位,而且彼此还互相加强:开放降低了顾虑,简单加快了扩散,时间点放大了需求,三股力拧成一股绳。绝大多数技术只占了其中一两样,于是热闹一阵就沉了下去,这也是为什么“全占齐“的案例如此罕见。

4.2 通用适配器:一个上百年的老模式

把MCP放进3.4节那个大模式里,它的历史定位就清楚了:它是“通用适配器“这个上百年老模式的最新一例,论原创性它谈不上石破天惊,论意义它可能被低估了。

这个模式每次出现,剧本都差不多。先是某个领域东西越堆越多、彼此又对不上,对接成本高到让所有人头疼。然后一个统一标准冒出来,把多对多的乱网捋成多加多。最后,那些原本被对接成本死死压住的需求,一下子被释放出来,引爆一波增长。集装箱之于全球贸易,USB之于个人电脑,都是这个剧本。

MCP正站在这个剧本的第二幕到第三幕之间。它已经把AI接工具的乱网捋直了,接下来很可能是一波应用爆发:当给AI接一个新能力的成本从“几天到两周“降到“写一次就到处能用“,过去因为太麻烦而没人做的无数小工具、小集成,会噗噗地冒出来。历史上每一次通用适配器的出现,后面都跟着这样一波由成本骤降点燃的繁荣。

所以给MCP定位,不必纠结它发明了什么全新的东西,它本来就不是靠原创取胜的。它的分量在于,它在对的时间,把一个被验证过无数次的老办法,用对了地方。

把这层意思说透:原创和重要,是两码事。MCP在技术上几乎没造什么新轮子,JSON-RPC是现成的,N加M的思路LSP用过,开放治理的玩法Kubernetes演示过。可正是这种“全是成熟零件的重新组合“,让它格外稳、格外快。它不必赌任何一项没被验证过的新技术,每个零件都已经在别处跑了好多年。给一个站在风口上的真实需求,配一套零风险的成熟方案,这种组合的杀伤力,常常比某个孤零零的天才发明还大。

4.3 最好的标准,最后都会消失

最后给你一把尺子,用来衡量MCP这类标准到底成不成。这把尺子有点反常识:最成功的标准,最后都会变得没人讨论。

想想USB-C。它刚出来时是科技新闻的热点,今天你插上充电线,脑子里压根不会闪过“USB-C“三个字,它已经隐进了日常,成了你默认它就该在那儿的东西。TCP/IP撑着整个互联网,可除了工程师,没人会在刷手机时想起它。一个标准真正赢了的标志,是它从话题变成空气,从“了不起的新技术“变成“理所当然的水电煤“。你不会每天感谢USB-C,正说明它彻底成功了。

按这把尺子,MCP正在快速走向“隐形“。截至2025年12月,它的SDK每月下载量超过9700万次,全网活跃的公开服务端超过一万个。这两个数字背后是无数开发者已经把它当成默认选项,接工具时顺手就用,不再当成一件需要讨论的新鲜事。

这就是MCP当下的历史位置:它正处在从“热门话题“沉降为“隐形基础设施“的过程中。下一代能自己动手干活的AI软件,很可能就架在这层大多数人永远不会直接看见的管道之上。它越是悄无声息地工作,越说明它赢了。

不过用这把“能不能消失“的尺子,也能照出MCP还没赢透的地方。一个标准要真正隐形,前提是它足够可靠、足够安全,可靠到没人需要为它操心。下载量和服务端数量说明MCP在“被采用“这件事上已经赢了,可它在“被信任到可以忘记“这件事上还差着火候,安全这一关还没过,下一章就讲这个。所以更准确的说法是:MCP正走在通往隐形的半路上,前半程靠开放和简单已经跑完,后半程要靠把可靠性和安全性补齐。

五、接下来往哪走

讲完来路和定位,最后看前路。这一章的纪律跟前面相反:多摆问题,少下断言。AI智能体这件事本身还在剧烈变动,凡是涉及未来的部分,能确定的不多,诚实的写法是把不确定性留给你自己判断。

5.1 无聊但关键:让MCP扛得住生产环境

MCP早期的形态,更偏一个能在开发者电脑上快速跑通的本地工具。要支撑起严肃的商业应用,它得先解决一堆听着无聊、却决定生死的工程问题。

一个是传输方式。早期版本用的是一种叫HTTP+SSE的老办法,2025年3月26日的规范换成了更现代的Streamable HTTP,一个能支持无状态服务的设计,更适合跑在云端那种随用随起的环境里。另一个是授权,谁有权调用哪个工具,得有一套严密的把关。新版本向业界成熟的OAuth 2.1标准看齐,2025年6月18日的规范进一步把MCP服务端正式定义成OAuth里的“资源服务器“,权限管理走的是和银行、企业系统同源的那套规矩。

在这之上,新能力也在往上长。2026年1月正式上线的MCP Apps,让工具不只能返回文字,还能直接在对话里渲染出可点击的界面,表单、图表、仪表盘。还有对长任务的支持,2025年11月的规范开始引入异步操作。Tasks作为实验扩展,进一步把长任务做成可轮询、可恢复的任务句柄。那些要跑很久的活儿,比如“花十分钟生成一份报告“,可以先返回一个任务号,让模型过会儿再来取结果,而不必干等着。这些更新合起来,是MCP从本地开发者工具长成生产工具的过程,单看每一条都不起眼,少了哪一条它都进不了真正的企业系统。

这些更新有个共同的方向:从“能在开发者电脑上跑通的本地工具“,长成“敢接进银行、医院、大公司核心系统的生产工具“。早期阶段,跑通就算成功。生产阶段,要操心并发、要操心权限、要操心断了线怎么恢复、要操心十万个用户同时调用会不会崩。这些活听着一点都不性感,远没有“AI自己会用工具“那么吸引眼球,但一个技术能不能从demo走向真正赚钱的应用,往往就卡在这些无聊的工程细节上。MCP这一年多的版本演进,大半力气都花在了这些不起眼的地方。

5.2 最大的隐患:安全还没解决

这一节不粉饰。MCP最大的软肋,是安全,而且这个问题到现在远没有解决。

最受关注的一类攻击叫工具投毒(tool poisoning),较早系统披露这类攻击的,是安全团队Invariant Labs。前面讲过,模型靠读服务端的自然语言描述来决定调用哪个工具。坏人正是钻这个空子:把恶意指令悄悄藏进工具的描述文字里,这段文字对模型可见,对你这个用户却不可见。模型读到了,就可能被诱导去调用危险的操作,或者把你的数据偷偷送出去,而界面上一点异常都看不出来。

还有一种叫地毯式抽离(rug pull):一个工具在你点头授权时人畜无害,过了你这关之后,它的描述和行为被悄悄改掉,一个已经被你信任的工具,变成了内鬼。更麻烦的是,恶意服务端能借着你已经连上的其它正常工具,把数据一层层倒腾出去,全程不在你眼前露面。

这些隐患的根子在于MCP的设计前提:你把一个能自主行动的模型,接到了一大堆工具上。每多接一个工具,就多开一扇可能被攻破的门。模型越自主、连的工具越多,攻击面就越大。这是个还在演进、远未定论的领域,任何说MCP已经安全了的话,现在都不能信。

更难办的是,这些攻击不是打个补丁就能根除的。它们的根源在MCP的工作方式本身:模型必须信任服务端给的自然语言描述,又被授权去动真实世界的东西,这两条凑在一起,天然就是攻击者的温床。安全圈里已经有人把“不可信上下文注入“列为这类系统的根本性风险,意思是只要模型会读外部来的文字、又会照着行动,这道口子就堵不严实。

实际的防护现在更多落在使用者一侧:别随便连来路不明的服务端,给工具的权限能小就小,重要操作留一道人工确认。这些都是权宜之计,算不上根治。把一个能自主行动的AI接上一堆工具,便利和风险是绑在一起卖的,这笔账每个想认真用MCP的人都得自己算清楚。

5.3 更大的图景:智能体的互联网

把视野再放大,MCP只是一个更大故事里的一块。如果说MCP管的是“AI怎么用工具“,那么另一个问题正浮上来:AI智能体之间,怎么互相对话?

这就有了A2A,智能体对智能体协议(Agent-to-Agent),最早由Google Cloud做出来,2025年6月也捐给了Linux基金会做中立治理。它要解决的是另一个维度的事:让不同公司、不同来源的AI智能体能互相发现、彼此协作,你的差旅智能体跟航司的智能体直接谈。MCP连的是“智能体和工具“,A2A连的是“智能体和智能体“,两者互补,拼起来像是在搭一张“智能体的互联网“。

这张网刚起头,前面全是开放问题,没有现成答案。这套标准会一直保持开放,还是会像历史上很多次那样,最终分裂成几个互不相让的阵营?把所有工具的接入方式都统一到一两个标准上,到底是让权力更分散了,还是反而让掌握标准的少数玩家更集中了?这些问题现在都没法下定论,值得你自己盯着往后看。

有一点值得留意:A2A和MCP这两套标准,眼下被收进了同一个屋檐下,Linux基金会。A2A是Google在2025年6月捐过去的,MCP是Anthropic年底捐过去的,连托管方都重叠。这或许说明,几家主要玩家想把“智能体怎么用工具““智能体之间怎么对话“这些底层规矩,都做成中立、开放、谁都能用的公共设施,而不是各自割据。

但这只是当下的一个走向,远谈不上定局。标准之争的历史反复说明,开放和分裂常常只隔一层窗户纸:今天大家共用一套规矩,明天某个巨头觉得自己够强了,完全可能另起炉灶。MCP和A2A能不能一直当好这层“智能体互联网“的公共管道,还是会重蹈历史上无数次标准分裂的覆辙,现在谁也打不了包票。

六、动手:最简单的上手

前面讲了一大堆“为什么“,这一章给你一个今天就能试的最小例子,不写一行代码。

最快的上手方式,是给一个支持MCP的桌面应用接上一个现成的server。以Claude桌面端为例,它会读一个配置文件,文件里写明你想接哪些server。社区已经做好了一大批server,文件系统、GitHub、各种数据库都有,你只要把它填进配置就行。

比如你想让Claude能读你电脑上某个文件夹里的文件,配置长这样:

{ “mcpServers”: { “filesystem”: { “command”: “npx”, “args”: [“-y”, “@modelcontextprotocol/server-filesystem”, “/Users/yourname/Desktop”] } } }

把这段填进Claude桌面端的配置文件(在设置的开发者选项里能找到它),保存,重启应用。这时候你再问Claude“我桌面上有哪些文件“,它就真能列出来了,而不是凭空编。你刚做的这件事,正是2.3节那张图里的安排:宿主(Claude桌面端)派出一个客户端,连上了一个服务端(filesystem这个server)。

想再往前一步、自己写一个server也不难。官方给了Python和TypeScript的SDK,一个最小的server也就几十行代码,无非是声明“我有哪个工具、要什么参数、干什么活“。那是另一篇教程的事了,这里你只要记住一点:从“读懂MCP“到“用上MCP“,门槛低到一段配置就能跨过去。

写在最后

这篇从头到尾都在回答一个问题:模型怎么从只会说,变成能动手。MCP给的答案很朴素,在AI和它要用的工具之间立一套通用接口,把原本要一个个定制对接的乱网,从N乘M捋成N加M。开头那个博学的瞎子,就是这样配上了一双手,够着了外面真实的世界。

它真正的分量,与其说在协议本身有多精巧,不如说在两件事上。一是它印证了一个反复上演的老模式,每当一个领域里东西越堆越多、彼此又对不上,就会冒出一个通用标准把混乱压成秩序,集装箱、USB-C、LSP、REST,一概如此。二是它赢下来的方式,把规范彻底交出去,连最大的对手都主动用上,又一次说明在标准这件事上,开放走得比封闭远。

但这事远没到尘埃落定的时候。最硬的一道坎是安全,把模型接进真实系统的同一刻,也把口子开给了风险,这一关还没真正迈过去。它能不能一直保持开放,还是哪天又裂成几个互不相让的阵营,眼下谁也打不了包票。

能确定的只有一点:我们正看着一个标准走完从惊艳到隐形的全程。它2024年底出生,一年铺遍行业,如今正悄悄沉进底层。等到哪天没人再提起MCP这三个字母,恰恰说明它已经彻底赢了,像TCP/IP那样活成了空气。而下一代能替你办事的软件,多半就长在这层你永远不会直接看见的管道上。

作者其它文章(选)

  • AI 大V 人物小传(上)

  • AI for Science 详细介绍(上):范式与版图

  • 广义祖父积分学

  • 什么是“涌现”?涌现的研究史

  • 互联网泡沫简史

  • AI圈大V名单(推特版)

  • 我打造的个人AI系统:哲学基础

  • NFT的叙事是如何崩塌的

  • 什么是耗散结构理论?它和AI有关系吗?

  • 什么是具身智能?它跟AI的关系是什么?

  • 一篇文章讲清楚美国的移民系统

  • 一文讲清楚美国医疗系统

  • 细说美国的华人老钱家族

  • 美国的犹太人和华人分别抢到了什么资源?

  • 一篇文章看懂美国教育全生态

  • 什么是控制论?控制论是AI的上辈子吗?

  • 祖父积分学概论

  • 教宗良十四世论人工智能(精华版)

  • Vibe Reading:AI 时代读书的系统化方法

  • 美国税收制度完全指南

相似文章

@AYi_AInotes: https://x.com/AYi_AInotes/status/2066865618104586525

X AI KOLs Timeline

这是一篇对OpenAI Codex的全景分析文章,详细介绍了其架构(五个入口)、三层可扩展能力(MCP、Skills、Plugins)、与Claude Code、Cursor、Devin的横评对比,以及七条可直接采纳的最佳实践。

@snowboat84: https://x.com/snowboat84/status/2064135804092645410

X AI KOLs Timeline

本文系统梳理了世界模型(world model)这一概念从1943年Craik的心理隐喻到2024-2026年产业爆发的演进历程,详细介绍了符号AI、深度学习流派(Schmidhuber-Ha、Dreamer系列、JEPA、视频生成方向)的核心理念与代表作品,并指出当前定义混乱、各派竞争的现状。