在当今快速发展的人工智能浪潮中,开发者们正不遗余力地探索智能代理的无限可能。然而,从模型选型到代理构建,再到测试部署,整个过程往往伴随着诸多挑战。微软适时推出了专为 Visual Studio Code 设计的 AI 工具包(AI Toolkit),旨在为智能代理开发者提供一站式、流畅高效的开发体验,让创新触手可及。

AI 工具包:智能代理开发的枢纽

AI 工具包并非一个简单的插件,而是一个功能强大的生态系统,它将智能代理开发的各个环节紧密整合。它赋能开发者,让他们能够以前所未有的速度和效率,轻松应对智能代理的复杂构建。

想象一下,你可以在数分钟之内完成以下关键任务:

  • 模型探索与评估:无需在各个平台间切换,AI 工具包为你汇集了来自 Anthropic、OpenAI、GitHub 等主流提供商的丰富模型资源。更令人兴奋的是,你甚至可以在本地运行基于 ONNX 和 Ollama 的模型,灵活满足不同场景的需求。
  • 智能代理的快速构建与测试:借助内置的提示生成器、快速入门模板以及与 MCP 工具的无缝集成,你可以在短短几分钟内搭建并测试你的智能代理原型,显著加速开发周期。

核心功能一览:赋能你的AI之旅

AI 工具包提供了一系列精心设计的模块,旨在覆盖智能代理开发的全生命周期:

模型目录:探索智能的无限可能

如同一个宝藏库,模型目录(Model Catalog)为你打开了通向各类AI模型的大门。在这里,你可以便捷地浏览和访问来自GitHub、ONNX、Ollama、OpenAI、Anthropic和Google等多样化来源的模型。无论是寻找特定领域的专业模型,还是探索多模态能力的前沿模型,这里都能满足你的需求,简化了模型发现的复杂过程。

交互式沙盒:模型能力的试炼场

Playground 提供了一个交互式的环境,让你能够快速、直观地测试AI模型的功能。在这里,你可以自由地输入各种提示,观察模型的响应,甚至尝试其多模态支持能力,从而深入了解每个模型的潜力与局限性。它就像一个实验台,让你在实际应用之前,充分验证模型的表现。

提示(代理)构建器:雕琢智能的艺术

好的提示是智能代理成功的关键。提示构建器(Prompt (Agent) Builder)提供了一系列工具,帮助你创建和优化高质量的提示。通过迭代式改进提示工程技术,你可以逐步提升代理的智能水平,使其更好地理解意图并生成精准响应。

批量运行:高效测试, масштабно验证

当你需要测试不同提示在多个模型上的表现时,批量运行(Bulk Run)功能将成为你的得力助手。它允许你同时向选定的模型发送多个提示,从而在各种输入条件下进行高效的规模化测试,大大节省了手动测试的时间和精力。

数据集评估:量化模型性能

评估一个AI模型是否达到预期,需要科学的衡量标准。AI 工具包支持使用数据集对AI模型进行测试,并提供了F1分数、相关性、相似性和连贯性等内置评估器。你也可以根据自己的特定需求创建自定义评估器,精确衡量模型的性能和准确性。

模型微调:定制专属的智能

通用模型虽然强大,但往往难以完美适配特定的使用场景。微调(Fine-tune)功能允许你根据特定的用例对模型进行定制,使其更好地适应专业领域和个性化需求,从而打造出更加精准和高效的智能代理。

开启你的AI开发之旅

AI 工具包的设计理念是让用户能够快速上手,并逐步深入。我们建议你从GitHub托管的模型开始探索:

  1. 安装与设置:首先,根据详细的安装指南,在你的设备上轻松设置AI 工具包。
  2. 探索模型:打开扩展视图,导航至“CATALOG”>“Models”,即可浏览可用的模型。GitHub托管的模型是理想的起点,它们通常易于访问且性能可靠。
  3. 初试身手:在模型卡片中,选择“在 Playground 中尝试”(Try in Playground),即可立即开始体验AI模型的功能,通过简单的交互感受智能的魅力。

构建强大的智能代理

构建AI代理是AI 工具包的核心所在,其代理构建器提供了一整套工具,帮助你从概念到实践,创建和优化你的智能代理:

  • 自然语言生成起始提示:用自然语言描述你的需求,工具包就能帮你生成初始提示,免去从零开始的烦恼。
  • 基于模型响应的迭代与优化:根据模型给出的响应,你可以不断迭代和完善你的提示,使代理的表现日益精进。
  • 通过提示链和结构化输出分解任务:将复杂的任务分解为更小的、可管理的子任务,并通过提示链和结构化输出实现流程化处理。
  • 实时运行与工具使用测试:通过实时运行和集成MCP服务器等工具,测试代理与外部系统的集成效果。
  • 生成可用于生产环境的代码:工具包能够帮你生成高质量、可直接用于生产环境的代码,加速应用开发。
  • 在提示中使用变量:通过引入变量,提升提示的灵活性和复用性,轻松应对不同输入。
  • 通过测试用例验证代理:使用测试用例对代理进行全面测试,确保其在各种情境下都能稳定运行。
  • 使用内置或自定义指标评估代理准确性和性能:量化评估代理的准确性和性能,帮助你做出数据驱动的优化决策。
  • 函数调用支持:赋予代理动态调用外部函数的能力,使其能够执行更复杂的实际操作。
  • 代理版本控制和版本比较:对代理的不同版本进行管理和比较,轻松追踪迭代过程中的变化和评估结果。

未来,AI 工具包还将带来更多激动人心的功能,敬请期待:

  • 代理的本地追踪和调试:提供更深入的本地调试能力,帮助开发者解决代理运行中的问题。
  • 将模型和代理部署到 Azure AI Foundry:无缝集成Azure AI Foundry,简化模型和代理的云端部署。
  • 将代理部署到云端:提供通用的云端部署能力,让你的代理触达更广泛的用户。

通过MCP服务器连接外部工具

智能代理的真正价值在于其与现实世界交互的能力。现在,AI 工具包允许代理通过模型控制协议(MCP)服务器连接到外部工具。这意味着你的代理将不再局限于生成文本,它能够执行查询数据库、访问API或执行自定义逻辑等实际操作。

  • 连接现有MCP服务器:无论是通过命令(stdio)还是HTTP(server-sent event),你都可以轻松连接到现有的MCP服务器,利用其提供的工具集。
  • 构建和脚手架新的MCP服务器:如果你需要自定义工具,AI 工具包提供了简单的脚手架,帮助你快速创建自己的MCP服务器,并在代理构建器中进行测试。

您的反馈是我们的动力

我们深知社区的力量,并珍视您的每一份反馈,它们将直接影响我们的产品路线图。我们鼓励您通过以下渠道与我们互动:

  • 开发者文档:查阅我们的开发者文档,了解更多详细功能和使用指南。
  • GitHub 反馈:在GitHub上提出问题或分享您的宝贵建议。
  • Discord 社区:加入我们的Discord社区,与其他开发者交流心得,共同成长。

AI 工具包衷心感谢开发者社区的支持与热爱!

数据和遥测

为了持续改进产品和服务,Visual Studio Code 的 AI 工具包会收集使用数据并发送给微软。您可以查阅我们的隐私声明以了解更多信息。此扩展尊重 telemetry.enableTelemetry 设置,您可以在禁用遥测报告文档中了解如何配置此设置。

查看更多详情