“我们正处在AI的iPhone时刻,”黄仁勋说。
英伟达的GTC 达会在昨晚正式举行,而黄仁勋也在此次活动中发表名为《切勿错过 AI 的决定性时刻》的主题演讲,介绍了英伟达在 AI 领域的相关布局和战略。
英伟达在此次活动中公布了一系列的 AI 产品,从帮助 AI 应用程序进行优化的推理平台到帮助各行各业发展的加速库应有尽有。而英伟达的主要目的,是帮助企业加速采用生成式人工智能。
英伟达宣布和Quantum Machines推出DGX Quantum,这是首个结合GPU和量子计算的系统,使用新的开源CUDA Quantum软件平台,该系统为从事高性能和低延迟量子经典计算的研究人员提供了革命性的新架构。
其中最主要的是H100 NVL,它将英伟达的两个H100 GPU拼接在一起,以部署像ChatGPT这样的大型语言模型(LLM)。“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”黄仁勋说。
“当前唯一可以实际处理 ChatGPT 的 GPU 是英伟达 HGX A100。与前者相比,现在一台搭载四对 H100 和双 NVLINK 的标准服务器速度能快 10 倍,可以将大语言模型的处理成本降低一个数量级,”黄仁勋说道。
除了直接用于AI推理的GPU之外,黄仁勋将目光移向了光刻领域。
黄仁勋在 GTC 上宣布了一项名为 CuLitho 的新技术,用以加快半导体的设计和制造。该软件使用英伟达芯片来加速基于软件的芯片设计,并加速用于在芯片上打印该设计的光刻掩模的物理制造之间的步骤。
CuLitho 在 GPU 上运行,其性能比目前的光刻技术提高了 40 倍,可以加速目前每年消耗数百亿个 CPU 小时的大规模计算工作负载。“造 H100 需要 89 块掩膜版,在 CPU 上运算时制造一块就得算两个星期,但如果用 H100 在 CuLitho 上运行就只需要 8 个小时,”黄仁勋说道。
英伟达表示,它正在与 ASML、Synopsys 和台积电合作,将该技术推向市场。据介绍,台积电将在 6 月开始准备该技术的试产。
“芯片行业是世界上几乎所有其他行业的基础,”黄仁勋表示。”由于光刻技术已处于物理学的极限,通过 CuLitho 以及与我们的合作伙伴台积电、ASML 和 Synopsys 的合作,晶圆厂能够提高产量,减少碳足迹,并为 2nm 及以后的发展奠定基础。”
除此之外,英伟达在今天还公布了一系列的云服务产品,首先要介绍的是全新的NVIDIA AI Foundations服务,它可以为企业提供AI模型构建、创建应用等服务。该服务基于英伟达的 NVIDIA NeMo 语言服务和 NVIDIA Picasso 图像视频和3D服务来构建专用的、特定领域的生成式AI应用,用于智能聊天和客户支持、专业内容创作、数字模拟等。
NVIDIA NeMo 和 NVIDIA Picasso 均基于 NVIDIA DGX Cloud 运行,用户可以通过浏览器进行访问。开发人员可以通过简单 API 来使用英伟达根据不同需求所提供的模型。这些模型将会在部署好之后为企业使用 NVIDIA AI Foundations服务提供基础。
据英伟达表示,每项云服务都包含六个要素,包括预训练模型、数据处理框架、矢量数据库、个性化优化推理引擎、程序编程接口和来自英伟达专家的支持。
英伟达宣布推出NVIDIA DGX Cloud,这是一项AI超级计算服务,能让企业立即访问为生成式AI和其他突破性应用程序训练高级模型所需的基础设施和软件。企业可按月租用DGX Cloud集群,确保快速轻松地扩展大型多节点训练工作负载的开发,而无需等待通常需求量很大的加速计算资源。微软Azure预计将在下个季度开始使用DGX Cloud,并且该服务将很快扩展到谷歌云。
湘ICP备19005331号-4copyright?2018-2024
guofenkong.com 版权所有
果粉控是专业苹果设备信息查询平台
提供最新的IOS系统固件下载
相关APP应用及游戏下载,绿色无毒,下载速度快。
联系邮箱:guofenkong@163.com