您的企业实现人工智能所需的最低可行基础设施是什么?What’s the minimum viable infrastructure your enterprise needs for AI?

环球医讯 / AI与医疗健康来源:venturebeat.com美国 - 英语2024-09-27 07:00:00 - 阅读时长9分钟 - 4205字
本文探讨了企业采用生成式人工智能所需的最低可行基础设施,包括数据存储、语言模型选择、RAG 框架、开发资源、时间和预算考虑以及部署维护等方面。
企业人工智能最低可行基础设施数据存储大型语言模型检索增强生成框架开发资源时间预算部署维护
您的企业实现人工智能所需的最低可行基础设施是什么?

随着我们接近 2020 年代中期,各种规模和行业的企业越来越关注如何采用生成式人工智能来提高效率并减少在重复繁重任务上花费的时间。

在某些方面,拥有某种生成式人工智能应用程序或助手正迅速从“可有可无”转变为“必须拥有”。

但是,实现这些好处所需的最低可行基础设施是什么?无论您是大型组织还是小型企业,了解人工智能解决方案的基本组成部分都至关重要。

本指南——由包括 Hugging Face 和谷歌的专家在内的行业领导者提供信息——概述了关键要素,从数据存储和大型语言模型(LLM)集成到开发资源、成本和时间表,以帮助您做出明智的决策。

>>不要错过我们的特辑:量身定制人工智能基础设施。<<

数据存储和数据管理

任何有效的生成式人工智能系统的基础都是数据——特别是您公司的数据,或者至少是与您公司的业务和/或目标相关的数据。

是的,您的企业可以立即使用由大型语言模型(LLM)驱动的现成聊天机器人,例如谷歌的 Gemini、OpenAI 的 ChatGPT、Anthropic 的 Claude 或网络上其他随时可用的聊天机器人——这可能有助于完成特定的公司任务。而且在不输入任何公司数据的情况下也可以这样做。

然而,除非您向这些模型输入您公司的数据——由于安全问题或公司政策可能不允许这样做——否则您将无法充分获得 LLM 所能提供的全部好处。

因此,为您的公司开发任何有用的人工智能产品(无论是内部使用还是外部使用)的第一步,是了解您拥有哪些数据并且可以与 LLM 共享,无论它是位于您自己控制的公共服务器还是私有服务器上,以及它是结构化的还是非结构化的。

结构化数据通常在数据库和电子表格中进行组织,具有明确定义的字段,如日期、数字和文本条目。例如,整齐排列在行和列中的财务记录或客户数据就是结构化数据的示例。

另一方面,非结构化数据缺乏一致的格式,并且不是以预定义的方式组织的。它包括各种类型的内容,如电子邮件、视频、社交媒体帖子和文档,不容易适应传统的数据库。由于其多样性和非均匀性,这种类型的数据更具分析挑战性。

这些数据可以包括从客户互动和人力资源政策到销售记录和培训材料的所有内容。根据您使用人工智能的情况——为员工内部开发产品还是为客户外部开发产品——您选择的路线可能会有所不同。

让我们假设一个家具制造商——“椅子公司”,用木材为消费者和企业制造椅子。

这家椅子公司希望为员工创建一个内部聊天机器人,可以回答常见问题,例如如何报销费用、如何请假以及制作椅子的文件在哪里。

在这种情况下,椅子公司可能已经将这些文件存储在云服务上,例如谷歌云、微软 Azure 或 AWS。对于许多企业来说,将人工智能功能直接集成到现有的云平台可以大大简化部署过程。

谷歌工作区与 Vertex AI 相结合,使企业能够在 Docs 和 Gmail 等生产力工具中利用其现有数据。

谷歌的一位发言人向 VentureBeat 解释说:“借助 Vertex AI 的模型花园,企业可以从 150 多个预构建模型中选择以满足其特定需求,并将它们无缝集成到其工作流程中。这种集成允许在谷歌工作区应用程序中创建自定义代理,简化流程并为员工节省宝贵时间。”

例如,百时美施贵宝(Bristol Myers Squibb)使用 Vertex AI 来自动化其临床试验中的文档流程,展示了这些集成在转变业务运营方面的强大功能。对于小型企业或新接触人工智能的企业,这种集成提供了一个用户友好的切入点,可以利用人工智能的力量,而无需大量的技术开销。

但是,如果公司的数据仅存储在内部网或本地私有服务器上怎么办?椅子公司——或任何处于类似情况的公司——仍然可以利用 LLM 并构建一个聊天机器人来回答公司的问题。然而,他们可能更愿意部署从编码社区 Hugging Face 获得的众多开源模型之一。

Hugging Face 的产品和增长负责人 Jeff Boudier 在最近接受 VentureBeat 采访时解释说:“如果您处于像银行或医疗保健这样高度监管的行业,您可能需要在内部运行一切。在这种情况下,您仍然可以使用在自己的基础设施上托管的开源工具。”

Boudier 为 VentureBeat 录制了以下演示视频,展示如何使用 Hugging Face 的网站以及可用的模型和工具为公司创建人工智能助手。

大型语言模型(LLM)

一旦您确定了可以并且想要输入到人工智能产品中的公司数据,下一步就是选择您希望为其提供动力的大型语言模型(LLM)。

选择正确的 LLM 是构建您的人工智能基础设施的关键步骤。像 OpenAI 的 GPT-4、谷歌的 DialogFlow 以及 Hugging Face 上托管的开放模型等 LLM 提供了不同的功能和定制级别。选择取决于您的特定需求、数据隐私问题和预算。

负责监督和实施公司人工智能集成的人员需要评估和比较不同的 LLM,他们可以使用网站和服务,例如 Hugging Face 上的 LMSYS 聊天机器人竞技场排行榜。

如果您选择使用像 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列或谷歌的 Gemini 系列这样的专有 LLM,您将需要通过 LLM 提供商的私有应用程序编程接口(API)将 LLM 插入到您的数据库中。

同时,如果椅子公司或您的企业希望在自己的私有基础设施上托管模型以增强控制和数据安全性,那么开源 LLM 可能是可行的选择。

正如 Boudier 所解释的,“开放模型的主要好处是您可以自己托管它们。这确保了您的应用程序的行为保持一致,即使原始模型被更新或更改。”

VentureBeat 已经报道了越来越多的企业采用来自 Meta 的 Llama 等公司以及其他提供商和独立开发者的开源 LLM 和人工智能模型。

检索增强生成(RAG)框架

为了使聊天机器人或人工智能系统提供准确和相关的响应,集成检索增强生成(RAG)框架至关重要。

这涉及使用检索器根据用户查询搜索相关文档,以及使用生成器(LLM)将信息合成为连贯的响应。

实施 RAG 框架需要像 Pinecone 或 Milvus 这样的向量数据库,它存储文档嵌入——您数据的结构化表示,使人工智能能够轻松检索相关信息。

RAG 框架对于需要集成以各种格式存储的专有公司数据(例如 PDF、Word 文档和电子表格)的企业特别有用。

这种方法允许人工智能动态地提取相关数据,确保响应是最新的并且在上下文中准确。

据 Boudier 说,“创建嵌入或向量化文档是使数据可供人工智能访问的关键步骤。这种中间表示允许人工智能快速检索和利用信息,无论是基于文本的文档,甚至是图像和图表。”

开发专业知识和资源

虽然人工智能平台越来越用户友好,但实施仍需要一些技术专业知识。以下是您可能需要的细分:

  • 基本设置: 对于使用预构建模型和云服务的直接部署,您现有的具有一些人工智能培训的 IT 人员应该就足够了。
  • 自定义开发: 对于更复杂的需求,例如微调模型或深度集成到业务流程中,您将需要数据科学家、机器学习工程师和在自然语言处理和人工智能模型训练方面有经验的软件开发人员。

对于缺乏内部资源的企业,与外部机构合作是一个可行的选择。基本聊天机器人的开发成本从 15,000 美元到 30,000 美元不等,而更复杂的人工智能驱动解决方案可能超过 150,000 美元。

“使用正确的工具构建自定义人工智能模型是可行的,但对于更专业的任务,例如微调模型或设置私有基础设施,您将需要技术专业知识,”Boudier 指出。“在 Hugging Face,我们提供工具和社区支持来帮助企业,但拥有或聘请合适的人才对于成功实施仍然至关重要。”

对于没有大量技术资源的企业,谷歌的 AppSheet 提供了一个无代码平台,允许用户通过简单地用自然语言描述他们的需求来创建自定义应用程序。与 Gemini 等人工智能功能集成,AppSheet 能够快速开发用于设施检查、库存管理和审批工作流程等任务的工具——所有这些都无需传统的编码技能。这使其成为自动化业务流程和创建定制聊天机器人的强大工具。

时间和预算考虑

实施人工智能解决方案涉及时间和财务投资。以下是您可以期待的:

  • 开发时间: 使用预构建模型,基本聊天机器人可以在 1 - 2 周内开发。然而,需要自定义模型训练和数据集成的更高级系统可能需要几个月。
  • 成本: 对于内部开发,每月预算约为 10,000 美元,复杂项目的总成本可能达到 150,000 美元。基于订阅的模型提供了更实惠的切入点,成本根据功能和使用情况从每月 0 美元到 5,000 美元不等。

部署和维护

一旦开发完成,您的人工智能系统将需要定期维护和更新以保持有效。这包括监控、微调,可能还需要根据您的业务需求和数据演变重新训练模型。维护成本可以从每月 5,000 美元开始,具体取决于系统的复杂性和交互量。

如果您的企业在金融或医疗保健等受监管的行业运营,您可能需要在私有基础设施上托管人工智能系统以符合数据安全法规。Boudier 解释说:“对于数据安全至关重要的行业,在内部托管人工智能模型可确保合规性,并完全控制数据和模型行为。”

最终要点

要为您的企业建立最低可行的人工智能基础设施,您需要:

  • 云存储和数据管理: 使用内部网、私有服务器、私有云、混合云或商业云平台(如谷歌云、Azure 或 AWS)有效地组织和管理您的数据。
  • 合适的 LLM: 选择适合您需求的模型,无论是托管在云平台上还是部署在私有基础设施上。
  • RAG 框架: 实施此框架以从您的知识库中动态提取和集成相关数据。
  • 开发资源: 考虑内部专业知识或外部机构来构建、部署和维护您的人工智能系统。
  • 预算和时间分配: 准备好初始成本从 15,000 美元到 150,000 美元不等,开发时间从几周到几个月,具体取决于复杂性。
  • 持续维护: 定期更新和监控是必要的,以确保系统保持有效并与业务目标保持一致。

通过将这些元素与您的业务需求相结合,您可以创建一个强大的人工智能解决方案,提高效率、自动化任务并提供有价值的见解——同时保持对您的技术堆栈的控制。

大健康
大健康