32位app有什么区别是什么意思(软件32位是什么意思)

ARM每年都会更新一次核心IP(公版架构),比如去年发布的Cortex-X2、Cortex-A710和Cortex-A510 Refresh(下文简称TCS 21),就因为改用面向下一个10年的ARMv9-A指令集而广受关注。

可惜,首发这三个核心IP的高通新骁龙Gen1却因采用三星4nm工艺,在功耗和发热方面的表现很差。直到联发科天机9000,以及改用台积电4nm工艺的骁龙8+的发布,才挽回了一点点口碑。

日前,ARM正式发布了2022年度的核心IP——Cortex-X3、Cortex-A715和Cortex-A510 Refresh(下文简称TCS 22),它们同样基于ARMv9-A指令集打造,主打(可选)更多的核心数量、更高的性能(峰值性能提升25%)和更低的功耗(能效提升20%)。此外,Mali GPU也进行了同步更新,下一代Mali-G715和Mali-G615 GPU已经蓄势待发。

更多的核心数量和变化

ARM为TCS 22,也就是Cortex-X3、Cortex-A715和Cortex-A510 Refresh准备了优化的DynamIQ技术以及全新的动态共享单元DSU-110,最多可以实现8(X3)+4(A715)+0(A510 Refresh)共计12核心设计,满足顶级游戏手机、平板电脑甚至PC对性能的苛刻要求。此外,还能实现1+4+4和2+2+4等核心组合。

DSU-110在微体系结构方面没有显着变化,ARM对其的调整主要是为额外的内核做好设计准备,对依赖内核数量的区域进行了更新,方案商可以根据需求,选择塞进更多的Cortex-X3实现更高性能,或是仅保留Cortex-A510实现更小的功耗。

TCS 22还通过对全新IP、Cortex-M85等组件的支持以及软件优化,在AI机器学习领域实现了显著的提升,在各项测试中都有着30%~43%的增长。

TCS 22在安全性方面引入了对非对称MTE(内存标记扩展)的支持,属于去年TCS 21首发对称MTE的扩展。记忆体区域和相关指标会标记为相同的标签,并由CPU检查是否相符。如果存在差异,则CPU会停止处理。对于不对称MTE,CPU可以在装载命令期间更新触发器,而在内存命令期间异步更新内存区域。

ARM还带来了增强的安全功能,禁止对用户模式下较低特权区域进行内核级访问,旨在防止用户模式攻击(例如通过欺诈内核进行攻击)。

TCS 22中使用的CoreLink CI-700相干互连技术和CoreLink NI-700片上网络互连技术没有什么变化,但针对台积电和三星最新的4nm、5nm工艺进行了特殊的优化,支持连接Cortex-M85,用于嵌入式解决方案,如智能扬声器或作为全天候处理器,使用DSP和机器学习功能来处理智能手机上的语音命令。此外,ARM还未开发者提供了方便的开发平台及工具VFP,可以更好地仿真测试等等。

CPU性能的变化

作为新一代的超级大核,Cortex-X3将解码器每周期指令从5个提升到6个,乱序执行窗口从288提升到320个,整数ALU单元从4个提升到6个,L2缓存容量从512KB提升到1MB,L3缓存容量可达8MB。在性能方面,对比当前最新Android旗舰智能手机提升了25%,单核心效能较之英特尔最新的酷睿i7处理器(i7-1260P,28W)还要快34%。

当然,这些比较存在很多限制条件,体现的也是基准测试中的部分项目。从ARM公布的IPC性能提升数据来看,Cortex-X3实际的IPC提升为11%,这个还是相对靠谱的。

作为新一代的大核,Cortex-A715此次不再追求更高的性能,而是主打更好的能效。从ARM公布的数据来看,Cortex-A715相较于上代Cortex-A710,能在相同性能下节省20%的能耗,或是可以在相同功耗下提升5%的性能。

作为新一代的小核,Cortex-A510 Refresh依旧注重更好的能效,和上代产品相比在相同性能时可以减少5%左右的能耗。

需要注意的是,在TCS 21时代,只有Cortex-A710同时支持Aarch32和Aarch64,运行老旧32位应用时存在功耗高的问题。在TCS 22时代,Cortex-A715不再支持Aarch32,而是让Cortex-A510 Refresh可以兼容Aarch32,但仅限特定的选择中。根据金标联盟最新发布的时间表,从今年12月起主流应用商店就将全面过渡到64位应用,游戏更新也不再允许单独更新32位包,估计到了TCS 23时代,ARM将在核心IP层面彻底放弃Aarch32。

GPU性能的变化

ARM同步发布的Immortalis-G715、Mali-G715和Mali-G615也值得引起我们关注,它们均支持VR,旗舰型号还能在智能手机、平板电脑和ARM笔记本电脑身上实现硬件光线追踪。

Immortalis-G715、Mali-G715和Mali-G615都采用第四代Valhall体系结构,它们之间的差异只是着色器的配置和计算单元数量不同。其中Immortalis-G715定位旗舰,也是家族唯一硬件支持光线追踪技术的GPU IP,最多可以搭配16个RTU,可选10~16个计算单元。

Mali-G715和Immortalis-G715的差别是不含RTU,可选7~9个计算单元。Mali-G615的计算单元数量下降到1~6个,性能垫底。

根据ARM的官方数据显示,TCS 22(1+3+4+Mali-G715)的游戏性能较之上代可以提升28%,值得期待。

据悉,TCS 22最快在2022年底就能商业化,首发Cortex-X3、Cortex-A715和Cortex-A510 Refresh这些CPU IP的芯片应该就是高通骁龙Gen2了,不知道这款未来的旗舰能否借助新工艺和新IP摘掉“火炉”之名?