近日,英伟达(Nvidia)宣布推出两项重磅 AI 服务:NVIDIA AI Foundry 和 NVIDIA NIM 推理微服务,为企业和各国提供了构建定制化 AI 模型的强大工具。这两项服务的独特之处在于,它们可以与 Meta 最新发布的 Llama 3.1 大模型完美结合,使用户能够打造满足特定需求的 “超级模型”。
英伟达创始人兼 CEO 黄仁勋表示,Meta 公开发布的 Llama 3.1 模型标志着全球企业采纳生成式AI 的重要时刻。NVIDIA AI Foundry 全面集成了 Llama 3.1,准备帮助企业构建和部署定制的 Llama 超级模型,为各行各业开发先进的生成式 AI 应用铺平道路。
AI Foundry 服务由 NVIDIA DGX™ 云 AI 平台提供支持,与领先的公共云提供商合作设计,旨在为企业和国家提供可扩展的计算资源,以满足不断发展的 AI 需求。该服务支持企业和国家发展主权 AI 战略,并为特定领域应用定制大型语言模型(LLMs)。
埃森哲(Accenture)成为首家利用 NVIDIA AI Foundry 为客户创建定制 Llama 3.1 模型的公司。埃森哲董事长兼 CEO Julie Sweet 表示:”世界领先的企业已经意识到生成式 AI 对各行业的变革潜力,他们迫切希望部署由定制模型驱动的应用程序。通过 NVIDIA AI Foundry,我们现在可以帮助客户快速创建和部署定制的 Llama 3.1 模型,推动其业务优先事项的变革性 AI 应用。”
NVIDIA AI Foundry 提供全面的端到端服务,包括模型策划、合成数据生成、微调、检索和评估。企业可以使用 Llama 3.1 模型和 NVIDIA NeMo 平台创建特定领域的模型,还可以选择生成合成数据以提高模型准确性。这些模型可以通过专有数据和 Llama 3.1 405B 及 NVIDIA Nemotron™ 奖励模型生成的合成数据进行训练。
针对 Llama 3.1 的 NVIDIA NIM 推理微服务现已可供下载,承诺比传统推理方法高出 2.5 倍的吞吐量。企业还可以将这些服务与新的 NVIDIA NeMo Retriever NIM 微服务结合使用,为数字助手和人类头像创建先进的 AI 检索管道。
此外,Aramco、AT&T 和 Uber 等公司也成为采用新 Llama NVIDIA NIM 微服务的早期用户,显示出各行业对这项技术的浓厚兴趣。目前,这些服务已在超过 16 000 个 NVIDIA H100 张量核心 GPU 上进行了训练,涵盖医疗保健、能源、金融服务、零售、运输和电信等多个领域。
为进一步推动AI技术的普及,NVIDIA 和 Meta 合作提供了 Llama 3.1 的蒸馏配方,使开发者能够构建适合各种基础设施的较小定制模型,从 AI 工作站到笔记本电脑均可适用。
NVIDIA AI Enterprise 将为 Llama 3.1 NIM 和 NeMo Retriever NIM 微服务提供生产支持。此外,NVIDIA 开发者计划的成员不久后将免费获得这些 NIM 微服务的研究、开发和测试访问权。
资料来源:综合报道;图片来源:英伟达官网截图