AMD MI355X 上的占用率计算:一份从基本原理出发的指南
本文从第一性原理出发,深入探讨了 AMD MI355X GPU 上的占用率(Occupancy)计算方法。文章系统性地介绍了计算单元(CU)架构、线程调度原理,以及如何通过寄存器、共享内存和指令流水线等资源限制来估算实际占用率。内容面向 GPU 性能优化工程师,提供了从硬件参数到数学公式的完整推导过程,帮助读者理解占用率对计算吞吐量的影响。
本文从第一性原理出发,深入探讨了 AMD MI355X GPU 上的占用率(Occupancy)计算方法。文章系统性地介绍了计算单元(CU)架构、线程调度原理,以及如何通过寄存器、共享内存和指令流水线等资源限制来估算实际占用率。内容面向 GPU 性能优化工程师,提供了从硬件参数到数学公式的完整推导过程,帮助读者理解占用率对计算吞吐量的影响。
An overheating 10GBASE-T SFP+ module in a home switch was replaced with a Broadcom-based model, fixing link flapping and lowering CPU temperature by about 5°C, though the new module does not report temperature and impersonates a fibre-optic Intel module in its EEPROM.
Mux Robots converts video data into actionable intelligence, enabling automated workflows for tasks like summarization and finding key moments. The platform, used by companies such as Synthesia, Shopify, and the U.S. Soccer Federation, offers a free tier with an additional $50 credit using the code FIREBALL.