qcon广州站web 3.0 专题上线,关注基础设施及相关技术,戳此了解
写点什么

英伟达正式宣布开源gpu内核模块代码-金马国际

  • 2022 年 5 月 13 日
  • 本文字数:3508 字

    阅读完需:约 12 分钟

近日,英伟达(nvidia),将 linux gpu 内核模块作为。早在几天前,nvidia 开始在 github 上陆续公开相关代码,目前该项目已经收获 7.7k star,众多网友对本次开源纷纷表示难以置信。

英伟达开源 gpu 内核模块代码


本次开源无疑可以帮助改善英伟达 gpu 在 linux 环境下的体验,与操作系统的紧密集成是帮助开发人员开展调试、集成和贡献回馈的重要一步。这些模块的开源还使得驱动程序在 linux 发行版供应商手中更加易用。英伟达也改进了开箱即用体验,让用户轻松对英伟达 gpu 驱动程序进行签署与分发。现在,canonical 和 suse 可以即刻将开放内核模块与 ubuntu 及 suse linux enterprise distributions 共同打包。



开发者可以跟进代码路径,查看内核事件调度如何与工作负载进行交互,从而快速开展根源性调试。此外,企业软件开发者现可将驱动程序无缝集成至项目配置的定制化 linux 内核当中。此番开源举措将帮助英伟达充分吸纳来自 linux 最终用户社区的意见和评论,进而提升 gpu 驱动程序的质量和安全性。

每次发布新驱动,英伟达都会在 nvidia/open-gpu-kernel-modules 页面上发布源代码快照。社区提交的补丁一旦经过审核批准,即可被集成到后续驱动程序版本当中。


关于更多详细信息,请参阅英伟达贡献指南()与驱动程序发布节奏与周期()说明文档。

支持的功能


作为首个开放 gpu 内核模块版本的 r515 不仅包含源代码,同时也提供驱动程序的完整构建与打包版本。

对于英伟达 turing 和 ampere 架构家族中的数据中心用 gpu 产品,此版本代码可用于生产支持。英伟达专注于测试各类工作负载,确保开源版本与专有内核模式驱动程序具备相同的功能和性能。


未来,hmm 等功能也将成为英伟达 hopper 架构上实现机密计算的基础组件。这个开源版本对 geforce 和 workstation gpu 的支持度已经很高。geforce 和 workstation 用户可以在英伟达 turing 和 ampere 架构 gpu 上使用此驱动来运行 linux 桌面,并在 vulkan 和英伟达 optix 中实现多屏显示、g-sync 和英伟达 rtx 光线追踪等功能。


开发者也可以选择将内核模块参数设置为 nvreg_openrmenableunsupportedgpus=1。在后续版本中,英伟达还将提供更加强大、功能齐备的 geforce 与 workstation 支持,最终推动英伟达开放内核模块全面取代闭源驱动程序。


拥有英伟达 turing 和 ampere 架构 gpu 的客户可以具体选择要安装的模块。对于 turing 之前产品的用户,将继续使用闭源模块。


开源内核模式驱动程序继续沿用相同的固件和用户模式堆栈,包括 cuda、opengl 和 vulkan,但驱动程序中的所有组件必须与发行版中的版本相匹配。例如,用户不能使用来自更早或更新版本中的用户模式堆栈,发布、构建或运行当前版本中的源代码。


关于如何安装正确版本的更多信息及其他故障排查步骤,请参阅驱动程序自述文件()。

安装选择


r515 版本包含闭源驱动程序和开源内核模块的预编译版本。这些版本间彼此互斥,需要在安装过程中做出选择。与英伟达 turing gpu 相比,默认选项提供的静默安装能够为英伟达 volta 及其他较早 gpu 提供最佳路径。可以根据源代码构建内核模块,并配合相关用户模式驱动进行安装。


图一:启用 gpu 内核模块和闭源模块默认路径的安装选项

上游方法


多年以来,英伟达 gpu 驱动程序在设计上一直强调跨操作系统、跨 gpu 和跨 jetson soc 实现代码共享,以确保能够在全部受支持的平台上提供一致的体验。但当前代码库并不符合 linux 内核设计约定,因此并未成为 linux 上游社区的备选方法。


但我们已经在积极筹划,希望与 linux 内核社区及金马国际的合作伙伴(包括 canonical、red hat 和 suse)合作开发上游方法。


与此同时,已发布的这部分源代码也可作为参考,帮助改进 nouveau 驱动程序。nouveau 与此次开源的驱动程序共享相同固件,因此公开的多项 gpu 功能,包括时钟管理与热量管理也将为 nouveau 驱动带来更多新功能。也欢迎大家继续关注 github 上的后续驱动发布与协作进展。

常见问题


哪里可以下载 r515 驱动程序?


开发者可以在 cuda toolkit 11.7 中下载 r515 开发驱动,或者在“beta”驱动程序中的驱动下载页面()处下载。r515 数据中心版驱动程序将根据英伟达的发布节奏,在后续版本中与大家见面。


开放 gpu 内核模块本身能否二次分发?


可以,英伟达开放内核模块遵循 gpl/mit 双许可,许可条款允许二次分发和打包。


英伟达是否会开放其他用户模式驱动程序(例如 cuda)?


此次变更主要针对内核模块,用户模式组件将保持不变。用户模式继续保持闭源形式,并将与驱动程序和 cuda 工具包内的预构建二进制文件一同发布。


开放 gpu 内核模块支持哪些 gpu?


开放内核模块支持所有英伟达 ampere 及 turing 架构 gpu。数据中心 gpu 将获得生产级支持,geforce 和 workstation gpu 则为高质量支持。关于更多详细信息,请参阅数据中心、英伟达 rtx 与 geforce cuda gpu 产品表()。可以看到,英伟达 turing 及更新 gpu 的算力评分均为 7.5 及以上。


如何上报 bug?


开发者可以通过 github repo 问题跟踪器()或我们的最终用户支持论坛()上报问题。另外,安全问题请通过 github repo 安全政策()中列出的渠道进行上报。


如何提交补丁?补丁 sla/cla 流程是怎样的?


欢迎社区通过 pr 请求在 github 页面上提交补丁。提交的补丁将在审查核准后,与其他修改成果一道被集成到后续驱动程序版本当中。关于更多详细信息,请参阅英伟达驱动程序生命周期()文档。


这里发布的源代码是根据共享代码库生成的快照,因此各项贡献可能不会在 github repo 中体现为单独的 git 提交。英伟达正在规划社区贡献认可流程。出于同样的理由,建议各位贡献者不要对代码进行重大格式调整。


提交 pr 请求的流程请参阅 nvidia/open-gpu-kernel-modules github 页面,贡献规则请参阅贡献者许可协议()。关于更多信息,请参阅开放 gpu 内核模块 nvidia/open-gpu-kernel-modules github 页面。


博客地址:


项目地址:


开源的重要意义


在英伟达宣布开源后不久,red hat 的桌面高级经理 christian f.k. schaller 发表了篇题为的文章表示,这次开源意味着英伟达已经发布了一个能够使用 linux 内核中 gpl-only api 的内核驱动程序,尽管这个初始版本不使用旧驱动程序未使用的任何 api。该驱动程序还仅支持 nvidia turing 芯片 gpu 及之后的更新版本,这意味着它不能用于 2018 年之前的 gpu。因此,对于大多数 linux 桌面用户来说,并不是立即可用。


对于开源社区来说,这意味着我们将有一个内核驱动程序和固件,允许改变 gpu 时钟,以提供研究者期望从英伟达显卡获得的性能;我们将拥有一个开源驱动程序,可以访问新一代英伟达硬件固件和内核更新;可以开始使用 linux 内核中的 gpl-only api。


canonical 公司芯片联盟副总裁 cindy goldberg 评论道,“新的英伟达开源 gpu 内核模块在简化安装流程之余,也提升了 ubuntu 用户的安全保障水平。无论您是 ai/ml 开发者、游戏玩家还是云用户,都能够从中受益。作为最受开发者欢迎的 linux 类操作系统 ubuntu 的开发商,我们现在能够立足 ubuntu 与英伟达 gpu 实现紧密集成,为 ai 和 ml 等前沿领域的开发人员提供更好的支持。”在未来几个月内,英伟达开放 gpu 内核模块将正式登陆刚刚推出的 canonical ubuntu 22.04 lts。


susesuse 公司业务关键 linux 总经理 markus noga 指出,“我们 suse 高兴地看到,英伟达决定将 gpu 内核模式驱动程序以开源形式发布。这是开源社区与加速计算领域的真正里程碑。suse 有幸通过今年 6 月的 suse linux enterprise 15 sp4,成为首个引入这一突破性成果的主要 linux 发行版。英伟达与 suse 将凭借安全的软件供应链和卓越的金马国际的技术支持,共同满足用户跨云、数据中心及边缘等位置的 gpu 加速计算需求。

2022 年 5 月 13 日 11:352755

评论

发布
暂无评论
发现更多内容

“芯”有灵“蜥” 走进 intel meetup

“芯”有灵“蜥” 走进 intel meetup

网站地图