英特尔AVX
作者:无名 • 更新时间:2024-05-15 13:41:58 •阅读
Intel最近宣布了新的“APX”(高级性能执行)和新指令集“AVX10”(高级指令扩展10),首次让P核和E核都支持AVX-512。
基本层面上,大核可以完整执行256/512位指令,而小核只能执行融合的256位指令(可以粗略地理解为支持AVX-256)。
从更深层次上来说,AVX10可以说是AVX-512的超集。它不仅包含所有AVX-512指令,对应的函数标识符为AVX-512VL,还包含256位向量寄存器、8个32位掩码寄存器、支持嵌入式舍入的256位指令的新版本。
其中,P核可以使用512位向量,E小核仅限于256位向量长度。
AVX10推出后,AVX-512也将被彻底冻结,不会有进一步的改变。以后的使用将通过AVX10来实现。
Intel强调,基于AVX-512和AVX10的现有应用程序的性能是相同的,至少在相同向量长度下没有差异。
使用AVX2编译的程序,重新编译以支持AVX10,将获得性能提升,并且无需再次调优软件。
由于额外的16 个向量寄存器和新指令,对向量寄存器压力敏感的AVX2 程序获得了最显着的性能提升。
高度线程化的矢量化应用程序在Ex 核上运行时可以实现更高的总体吞吐量。
本文由无名发布,不代表东辰网立场,转载联系作者并注明出处:https://www.ktwxcd.com/sszx/270827.html