FIND研究員:古廸鴻
在人工智慧(AI)技術迅速發展的今天,大型語言模型(LLMs,Large Language Models)如ChatGPT、Claude等已廣泛應用於各種領域。然而,這些模型在實際應用中常面臨一個核心挑戰,就是模型如何與外部工具有效整合。
傳統上開發者需要為每個工具或資料源建立專屬的整合方式,導致開發成本高昂且難以維護,造成了「M×N」的整合問題,限制了AI模型的靈活性和可擴展性。這種傳統整合方式,如圖1所示,就如同每一個應用服務都是一個獨立的鎖,而開發者必須為其打造一把專屬的鑰匙。舉例來說,無論是整合Gmail、Google日曆等應用,都需透過不同的API機制進行認證、授權與資料轉換。這些API如同外觀相異的鎖孔,缺乏統一的標準,而開發者必須為每一種服務分別打造對應的「鑰匙」來解鎖功能,增加整合的複雜度與維運負擔。為了解決這個問題,Anthropic提出了一個開放標準MCP(Model Context Protocol)來簡化AI模型與外部工具的整合流程。
圖1 :API整合挑戰
資料來源:aman.ai
【MCP協定-AI應用的USB-C】
MCP(Model Context Protocol)是一種開放標準,目的在於為AI模型與外部系統之間的互動提供統一介面。就如同 USB-C 為電子設備提供了通用連接標準,MCP讓各種AI模型、外部工具與資料源能夠「即插即用」,解決過去繁瑣且不一致的整合方式。
透過MCP,開發者不再需要為每個應用服務撰寫冗長的函式呼叫功能(function calling)或API封裝邏輯。模型只需透過統一的MCP描述檔案,即可調用各種工具與資料來源,如同插上USB-C一樣自然與一致,如圖2所示。這種標準化機制不但大幅降低整合開發成本與維護負擔,更加快原型開發與應用擴展速度,讓開發者可以將心力專注於創新應用本身,而非在每次專案中「重新造輪子」。
圖2: MCP 架構圖
資料來源:aman.ai
【技術應用案例-自然語言控制3D建模】
圖3為結合大型語言模型Claude與3D建模軟體Blender的實驗性開源專案實際測試畫面。此專案透過MCP架構,讓使用者僅需輸入簡單的自然語言提示(Prompt),AI即能自動轉譯指令並在Blender中建立對應場景。以此範例,例如跟語言模型說:「建立一個陽光明媚的草地場景,加入幾棵樹與一座小木屋」。
圖3: 自然語言控制3D建模
資料來源:本文作者實際執行畫面
左側是Claude的對話介面,模型會逐步拆解使用者的自然語言需求,轉換為具體的建模指令(例如建立地面、植樹、放置小屋等),並透過MCP定義的execute_blender_code 這樣的介面執行。右側則是Blender的實作畫面,可看到系統已自動建構出草地、小木屋、幾棵簡單的樹,並透過套件如Sapling Tree Gen自動產生樹木外型。
透過這樣的應用整合,使用者可以使用自然語言完成在Blender上的創作,大幅降低3D工具的使用門檻,展示了MCP架構在「自然語言驅動工具控制」上的潛力。
【FIND觀點】
MCP作為一種解決AI整合問題的創新方案,正在逐步改變AI應用系統的開發方式。其標準化的整合流程不僅降低了開發成本。這樣的轉變不只降低開發門檻與維運成本,更進一步提升了AI應用的靈活性、模組性與上下文感知能力,然而MCP的推廣仍面臨兩項挑戰須關注:
安全性與認證機制的建立:隨著AI模型與更多外部系統的整合,如何確保資料的安全性和隱私性成為重要課題。
對於現有系統的整合與遷移成本:將現有的應用系統遷移到MCP架構可能需要投入大量的資源和時間。
儘管如此,隨著越來越多的企業、開發平台與開源社群投入MCP的實驗與部署,其生態系統正快速成形。這不僅為AI技術本身提供了更強的實用性,也改變了整個生成式AI生態帶來可擴展、可維運、可控的發展基礎。
參考資料來源:
1.anthropic:https://www.anthropic.com/news/model-context-protocol
2.aman.ai:https://aman.ai/primers/ai/agents/
3.blender-mcp:https://github.com/ahujasid/blender-mcp
沒有留言:
張貼留言