英伟达放大招光刻计算提速40倍
出品 | 搜狐科技
作者 | 梁昌均
美国当地时间3月21日,英伟达GTC 2023大会如约而至,英伟达创始人兼CEO黄仁勋一如往常身着黑色皮衣,发表了近80分钟的主题演讲。
这次被黄仁勋称为“迄今为止最重要的一次GTC”有超过25万人参加。他在演讲中多次提到,AI的“iPhone”时刻已经到来,而英伟达将在生成式AI领域进行软硬件全面布局。同时,他还公布了英伟达在加速计算、量子计算、元宇宙等领域的技术和应用情况。
AI进入“iPhone”时刻,推出专用云服务
黄仁勋在演讲中数次提到生成式AI,称“ChatGPT是震惊世界的AI”。他认为,这意味着崭新的计算平台的诞生,AI的“iPhone”时刻已经到来,加速计算和AI技术已经走进现实。
在黄仁勋看来,ChatGPT、Stable Diffusion、DALL-E和Midjourney等生成式AI工具唤醒了世界对生成式AI的认知,尤其是ChatGPT作为迄今历史上用户数量增长最快的应用,生成的文本令人赞叹。
黄仁勋认为,生成式AI是一种新型计算机,一种可以用人类语言进行编程的计算机,每个人都可以命令计算机来解决问题,而这之前是只有程序员才能接触的领域,现在每个人都可以是程序员。
他同时还称,生成式AI是一种新型计算平台,与PC、互联网、移动设备和云类似。正如此前的互联网一样,生成式AI也将重塑每个行业。
不过,黄仁勋提到,一些专业领域的公司需要使用专有数据来定制模型,他们需要制定使用规范,并优化模型,契合公司安全、隐私和安保要求。“这个行业需要一个类似台积电的代工厂,来构建自定义的大型语言模型。”
为此英伟达宣布推出AI Foundations,黄仁勋将其称为云服务和代工厂,其可以让企业使用专有数据进行训练、处理特定领域的任务,构建自定义的语言模型和生成式AI。
英伟达AI Foundations包括语言、视觉和生物学模型三个方面服务,其中Nemo用于构建定制的语言文本生成模型,通过Nemo可以快速生成文本,最快捷的方法是从英伟达的某项先进的预训练基础模型入手,轻松自定义一个模型,并进行参数调优,如汇总财务文档、创建特定品牌内容、个性化写作风格撰写邮件等,将模型链接到专有数据库,可确保响应是准确和最新的,并可以通过指定区域放防止模型出现意外。
Picasso是一项视觉语言模型制作服务,可以用于生成式AI赋能的图像、视频和3D应用,企业可以使用自己的数据来部署和训练自己的模型,并可将生成的素材导入编辑工具或Omniverse,以构建逼真的虚拟世界、元宇宙应用和数字孪生仿真。Getty Images、Shutterstock和Adobe等企业已经开始使用该项服务。
黄仁勋还表示,英伟达将和Adobe共同构建一系列新一代AI功能,打造创意领域的未来,将生成式AI融入营销和创意专业人士的日常工作中,新的生成式AI模型将对图像、视频、3D和动画制作进行优化。同时,为保护艺术家的权利,Adobe正在开发以商业可行性和正确内容归属为重点的方案,由Adobe的“内容真实性倡议”提供支持。
第三个是面向的生物学的BioNeMo,其可帮助研究人员使用专有数据创建、微调和提供自定义模型,让研发人员轻松加速药物研发工作流,可以进行蛋白质预测、分子生成、分析连接等,节省药物研发时间和资金成本。
在应用方面,英伟达与三菱联合发布了将用于加速药物研发的日本第一台生成式AI超级计算机Tokyo-1。Tokyo-1通过使用BioNeMo软件,研究人员能运行高达数十亿参数的先进AI模型,可用于蛋白质结构预测、小分子生成、姿态估计等。
推出DGX Cloud,登浏览器即可访问AI超级计算机
黄仁勋在演讲中还讲述了英伟达是如何踏入生成式AI革命这一波技术浪潮。“英伟达加速计算始于DGX(AI超级计算机),这是大型语言模型实现突破背后的引擎。”
他提到,2016年其亲手将全球首款DGX交给了OpenAI,自此以后《财富》100强企业中有一半安装了DGX AI超级计算机。“DGX已成为AI领域的必备工具,是现代AI工厂,并正在不断扩展应用范围,能够全天候运行优化数据和处理AI。”
为了让这项能力更简单快捷地访问,英伟达宣布推出DGX Cloud,通过与微软云、谷歌云和甲骨文合作,通过一个浏览器就可以将DGX AI超级计算机即时接入每家公司,其中甲骨文(OCI)将成为首个英伟达DGX Cloud落地企业。
黄仁勋表示,DGX Cloud经过优化,可运行英伟达加速库套件AI Enterprise,从而将英伟达生态系统融入到云服务提供商。目前,英伟达全球生态系统涵盖400万开发者、4万家公司和1.4万家初创公司。
“生成式AI引发了全球企业制定AI战略的紧迫感,而这种双赢和合作伙伴关系为迫切需要使用生成式AI的客户提供了在全球云端即时访问英伟达AI超级计算机的机会。”黄仁勋说。
据介绍,英伟达AI超级计算机DGX H100拥有8个H100 GPU模组,在FP8精度下可提供32PetaFLOPS的算力,而H100 配有Transformer引擎,以处理类似惊人惊叹的ChatGPT模型。这8个H100 GPU模组协同工作,就像一个巨型GPU计算网络。
黄仁勋宣布,英伟达AI超级计算机已全面投入生产,很快将面向全球企业。微软宣布Azure将向其H100 AI超级计算机开放私人预览版,谷歌、亚马逊、联想、戴尔等也是合作伙伴。
此外,英伟达还宣布推出全新GPU推理平台,包括用于图像生成的L40,它针对图形和AI支持的2D、视频和3D图像生成进行了优化,推理性能是英伟达最受欢迎的云推理GPU T4的10倍。
针对AI视频设计的通用GPU L4,可提供比CPU高120倍的AI视频性能,能效提高99%,并优化了视频解码与转码、视频内容审核、视频通话等功能。
同时面向ChatGPT等大型语言模型的大规模部署推出H100 NVL,它配备双GPU NVLink,将两张拥有94GB HBM3显存的PCIe H100 GPU拼接在一起,可处理拥有1750亿参数的GPT-3大模型,同时支持商用PCIe服务器轻松扩展。
黄仁勋表示,目前在云上唯一可以实际处理ChatGPT的GPU是HGX A100。但与HGX A100相比,一台搭载4对H100及双GPU NVLink的标准服务器的速度要快10倍,并可将大型语言模型的处理成本降低一个数量级。
计算光刻加速超40倍,可代替4万台CPU服务器
除了生成式AI,另一大亮点是英伟达面向芯片制造领域的重大突破——计算光刻库cuLitho。这项突破由英伟达联合全球最大芯片制造商积电、全球最大光刻机制造商ASML和全球最大EDA供应商Synopsys研发四年实现,它将计算光刻加速了40倍以上。
计算光刻模拟了光通过光学元件并与光刻胶相互作用时的行为,应用逆物理算法来预测掩膜板上的图案,以便在晶圆上生成最终图案。
黄仁勋表示,计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时,需要大型数据中心全天候运行,以便创建用于光刻系统的掩膜板,而这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。
随着算法越来越复杂,计算光刻技术也在快速发展。英伟达的cuLitho可以助力芯片制造提升效率并减少功耗,达到事半功倍的效果,也是推动2纳米级以上先进工艺的关键。
黄仁勋在演讲中就提到,目前在CPU上运行时处理单个掩膜版需要两周时间,而在GPU上运行cuLitho只需8小时就能处理完一个掩膜版。
他表示,台积电可以通过在500个DGX H100系统使用cuLitho加速,将功率从35MW降至5MW,从而替代用于计算光刻的4万台CPU服务器。
借助cuLitho,台积电可以缩短芯片制造周期,提高产量,减少制造过程的碳排放,并为2纳米以上的生产做好准备。黄仁勋表示,台积电将于6月开始对cuLitho进行生产资格认证。
此外,黄仁勋还透露,在涵盖光线追踪和神经渲染、物理、地球和生命科学、量子物理学、化学和计算机视觉、数据处理、机器学习和AI的300个加速库和400个模型中,英伟达今年更新了其中的100个,让正在使用的用户享受到更高的性能和更多的功能。
推出全球首个GPU加速量子计算系统,为宝马打造虚拟工厂
黄仁勋还透露了英伟达在DPU、量子计算、元宇宙等领域的新进展。在数据处理单元(DPU)方面,黄仁勋宣布英伟达BlueField-3 DPU已投入生产,并被百度、CoreWeave、京东、微软Azure、Oracle OCI、腾讯游戏等厂商采用,以加速其云计算平台。
在量子计算方面,英伟达正在与全球量子计算研究社区合作。要从量子噪声和退相干中恢复数据,需要对大量量子比特进行纠错,英伟达和Quantum Machines合作开发出一个量子控制链路,可将英伟达GPU链接到量子计算机,以极快的速度纠错。
据介绍,双方合作研发的全球首个GPU加速量子计算系统英伟达 DGX Quantum平台由库和系统组成,可供研究人员推进量子编程模型、系统架构和算法,而cuQuantum是一个用于量子电路仿真的加速库。IBMQiskit、Google Cirq、百度量易伏、QMWare、QuEra、Xanadu Pennylane、Agnostig、AWS Bracket已将cuQuantum集成到它们的仿真框架中。
“虽然商用量子计算机还有十到二十年的时间才能实现,但很高兴通过英伟达 Quantum为这个充满活力的大型研究社区提供支持。”黄仁勋表示。
面向元宇宙领域,英伟达推出了第三代OVX计算系统和新一代工作站RTX 4000 SFF Ada Generation,为英伟达Omniverse 的大规模数字孪生提供动力。
第三代OVX服务器通过组合双CPU平台、BlueField-3 DPU、L40 GPU、两个ConnectX-7 SmartNIC和英伟达Spectrum以太网平台,提供了突破性的图形和AI性能,可加速大规模数字孪生模拟等应用,进而提高运营效率和预测性规划功能。
黄仁勋还宣布了英伟达元宇宙平台Omniverse的相关更新,增加了一系列生成式AI、模拟仿真相关功能,让开发者能够更轻松地部署工业元宇宙应用。他表示,Omniverse Cloud是用于工业数字化的从数字到物理的操作系统,它的出现正好赶上了正在建设的价值数万亿美元的新电动汽车、电池和芯片工厂。
微软Azure成为英伟达Omniverse Cloud的首个云服务提供商,并在下半年推出相关服务。企业可访问Omniverse软件应用程序的全堆栈套件和英伟达 OVX基础设施,并享有Azure云服务的规模和安全性。
在应用方面,亚马逊利用英伟达Omniverse平台构建了逼真的数字孪生机器人仓库。英伟达还与宝马集团宣布扩大合作,为汽车制造商开设了第一个完全虚拟工厂,宝马集团将Omniverse平台用在其全球生产网络中构建和运行工业元宇宙应用。
同时,借助Azure的Omniverse Cloud服务,汽车团队无论是在连接3D设计工具以加速汽车开发,还是构建汽车的数字孪生工厂或运行闭环模拟来测试车辆性能等方面都可轻松实现工作流程的数字化。