生成式 AI
NVIDIA AI Foundry
用于构建生成式 AI 定制模型的端到端平台和服务。
新闻稿 | 博客
概述
NVIDIA AI Foundry 是使用企业数据和特定领域知识构建生成式 AI 定制模型的平台和服务。如同台积电代工生产其它企业设计的芯片一样,NVIDIA AI Foundry 使企业能够开发自己的 AI 模型。
芯片代工可提供最先进的晶体管技术、制程、大型晶圆代工厂、专业知识以及包含第三方工具和资料库提供商的多元化生态系统。 同样,NVIDIA AI Foundry 包括 NVIDIA 创建的 AI 模型,如 Nemotron 和 Edify 等流行的开源基础模型,用于定制模型的 NVIDIA NeMo™ 软件,以及由 NVIDIA AI 专家构建和支持的 NVIDIA DGX Cloud 专用计算能力。 输出形式是一个 NVIDIA NIM™ 推理微服务,包括自定义模型、经过优化的引擎和标准 API——可随时随地部署。
NVIDIA AI Foundry 及其资料库可整合到世界领先的 AI 生态系统中,包括初创公司、企业软件提供商和全球服务提供商。
借助 NVIDIA AI Foundry,企业可以根据其特定组织、行业或文化需求,构建量身定制的生成式 AI 解决方案。
NVIDIA AI Foundry 使用企业数据以及合成生成的数据来增强和更改预训练基础模型中包含的通用知识。一旦模型被定制、评估并设置护栏,其输出将是一个 NVIDIA NIM 推理微服务。开发人员使用 NIM 标准 API 来构建由生成式 AI 赋能的应用。 从部署中的应用中获得的知识可以反馈到 AI Foundry,以进一步改进自定义模型。
优势
从最先进的基础模型着手,使用您的企业数据和领域专业知识,基于您的应用需求创建自定义模型。
专注于运用组织知识,发挥 AI 所带来的变革式洞察力的作用,而非维护和调整 AI 开发平台。
通过创建您自己的模型来保护数据隐私和知识产权。借助 NVIDIA 企业级支持、API 稳定性和可靠的安全更新,确保在生产环境中正常运行。
使用最新的 NVIDIA 架构在 DGX Cloud 上与您首选的云服务提供商 (CSP) 高效构建模型。部署自定义模型,并使用优化引擎,封装成易于使用的 NVIDIA NIM 推理微服务。
生成式 AI 模型
企业可以利用社区和 NVIDIA 构建的模型,对其进行优化,在 NVIDIA 加速基础设施上获得最佳性能。这些模型可以通过 NVIDIA NeMo 定制,并通过 NVIDIA NIM 随时随地大规模部署到生产中。
开始自定义优化的大语言模型、视觉语言模型、语音模型以及医疗健康模型,以提高用例准确性。
NVIDIA NeMo
NVIDIA NeMo 是用于随时随地开发定制生成式 AI 的端到端平台,包括大语言模型 (LLM)、多模态、视觉和语音 AI。 提供企业就绪模型,具备精确的数据管护、尖端的定制和经优化的性能。
包括用于加速数据管护的 NeMo Curator、用于简化微调的 NeMo Customizer、用于评估 AI 模型的 NeMo Evaluator 以及用于保护您的大语言模型的 NeMo Guardrails。
NVIDIA DGX Cloud
要定制 AI 模型,需要获得重要的计算资源、AI 专业知识和软件来简化 AI 模型开发。
NVIDIA DGX Cloud 是一个面向开发人员的端到端 AI 平台,搭载最新的 NVIDIA AI 架构,提供专用算力,并与世界领先的 CSP 共同开发。在 DGX Cloud 上构建自定义的 AI 模型。
NVIDIA NIM™
NVIDIA AI Foundry 输出形式是 NVIDIA NIM,可以随时随地快速部署和扩展自定义模型。
NVIDIA NIM 是一组易于使用的微服务,旨在提供安全、可靠地跨云、数据中心和工作站的高性能 AI 模型推理部署服务。
NVIDIA AI 生态系统
数百家 NVIDIA 技术合作伙伴正在将 NVIDIA NIM——NVIDIA AI Enterprise 的一部分——集成到他们的平台中,以加快特定领域应用的生成式 AI 部署。
合作伙伴包括主要的公有云、系统构建者、企业基础设施提供商、MLOps 和 AIOps 领导者等等。
NVIDIA 合作伙伴
NVIDIA AI Foundry 由 NVIDIA AI 专家构建并提供支持。
NVIDIA 和 NVIDIA 合作伙伴网络 (NPN)——包括全球领先的系统集成商、服务交付合作伙伴和解决方案提供商——准备就绪,随时帮助您为您的企业应用构建定制化的模型。
用例
了解 NVIDIA AI Foundry 如何支持行业用例并快速启动您的 AI 开发。
企业组织正在寻求使用自定义大语言模型 (LLM) 和检索增强生成 (RAG) 构建更智能的人工智能聊天机器人。 借助 RAG,聊天机器人可以通过从组织的知识库中检索当前信息,并提供自然语言的实时响应来准确回答特定领域的问题。这些聊天机器人可用于增强客户支持、个性化 AI 头像、管理企业知识、简化员工入职、提供智能 IT 支持、创建内容等。
生成式 AI 基于企业的领域专业知识和专有 IP 生成高度相关、定制化和准确的内容。
Katana
全球电信公司正在探索如何在 5G 和即将到来的 6G 网络上,以经济高效的方式将新的 AI 应用在边缘计算中交付实施。借助 NVIDIA 加速计算和 AI,电信运营商、云服务商和企业可以构建高性能的云原生网络 (包括固定和无线网络),且具备更高的能源效率和安全性。
Agility, Apptronik, Fourier Intelligence, Unitree
在金融服务领域,处理涉及复杂数据的文件,如贷款记录、外部监管文件、交易记录、公开市场文件等。 金融机构可以使用自定义生成式 AI 实现智能文档处理,例如用 RAG 构建聊天机器人来自动化贷款流程,或为投资组合构建和交易执行产生市场洞察。
补丁软件安全问题正变得越来越具有挑战性,常见漏洞和暴露 (CVE) 数据库中报告的安全漏洞数量在 2022 年创下历史新高。 生成式 AI 可以改善漏洞防御,同时减少安全团队的负担。
Delta Electronics
零售商库存纷繁复杂,没有数百万也有成千上万种产品随季节变化。 在过去十年出现的竞争极其激烈的市场中,领先的零售商已开始利用人工智能和数据科学的力量,提供实时、超个性化的客户体验,增加购物车的大小,建立品牌亲和力并提高转化率。
Verneek
使用正确的工具和技术来构建自定义生成式 AI 模型。
在 ai.nvidia.com 上使用各种基础模型进行测试和构建。
使用 NVIDIA NeMo 软件和低秩自适应 (LoRA) 定制化技术,构建自定义大语言模型。
是否需要查看最新的 NVIDIA AI 技术? 使用 DGX Cloud 训练您的自定义 AI 模型,并根据您的 AI 需求的变化轻松扩展。
客户案例
客户:ServiceNow
产品:NVIDIA AI Foundry、NVIDIA NeMo、NVIDIA DGX Cloud
技术:大语言模型
Amdocs
客户:Amdocs
产品:NVIDIA AI Foundry、NVIDIA NeMo
客户:Getty
产品:NVIDIA AI Foundry、NVIDIA Picasso
技术:视觉语言模型
生态系统
后续步骤
与 NVIDIA 专家讨论如何将自定义生成式 AI 应用从试点运用到生产,并充分利用 NVIDIA AI Enterprise 的安全性、API 稳定性和支持服务。