ARM Cortex-A32 – 复杂嵌入式设备的必然选择-华强资讯-华强电子网

ARM Cortex-A32 – 复杂嵌入式设备的必然选择

来源：华强电子网 作者：--- 时间：2016-08-18 13:39

ARM Cortex-A32 嵌入式设备 ARM Cortex-A32 嵌入式设备

　　前言

　　ARM处理器在嵌入式设备领域的应用非常广泛。其中，ARM Cortex-A处理器通常用于需要操作系统或高性能支持的应用程序;Cortex-R处理器用于实时性能要求较高的应用程序;而Cortex-M处理器则更适用于类似小型微控制器的应用程序。

　　就Cortex-M处理器核心来讲，ARM已经拥有非常丰富的产品类型。Cortex-M0是同系列的首款处理器，设计初衷是利用其小体积、低功耗的优势，满足深度嵌入、成本敏感的应用程序的要求，例如智能传感器节点。Cortex-M3处理器和Cortex-M4处理器则主要针对大众市场的微控制器。Cortex-M7处理器则是整个系列的最高端产品，性能更高，可以处理计算强度极高的工作负载，也包括信号处理。

　　基于ARMv6-M和ARMv7-M架构的Cortex-M处理器，以简单易用的编程模型，通过搭载高度可配置核心，满足多种不同设备的应用。

　　对多数嵌入式应用而言，尽管Cortex-M核心拥有简单易操作的强大优势，但仍有很多用例需要更丰富、更强大的环境。一方面，这些应用对效率和功耗依然十分敏感;但另一方面，诸如Linux或Android的操作平台依旧不可或缺。迁移至类似操作系统，应用程序即可利用规模更大、内容更丰富、设计更精致的软件生态系统。

　　Cortex-M处理器关注的重点不是运行更高层次的操作系统，因此也不需要考虑运行负责操作系统的必备功能。例如，Cortex-M没有内存管理单元(MMU)，不支持虚拟存储环境，因此也就不支持这类操作系统。如果应用程序需要更丰富的操作环境，通常第一个选择是“超高效率”的Cortex-A核心。这些核心可以为平台操作系统提供更高级的功能支持，同时保持对很高的功耗效率。上述内容代表了更先进、更灵活的编程模式。

　　得益于此，ARM Cortex-A处理器在深度嵌入式应用程序中得到广泛部署;尤其是在需要Linux或其他复杂操作系统的市场中，其采纳更为普遍。

QQ截图20160818134137.png

　　图1- Cortex-A处理器和架构

　　图1介绍了目前的Cortex-A处理器家族，绿色高亮的是“超高能效”核。本白皮书将重点介绍其中的最新产品Cortex-A32。

　　对希望利用复杂操作系统环境或Cortex-A系列处理器强大性能和功能的应用来讲，Cortex-A32是一款理想的入门产品。它是ARMv8-A 架构中能效最高的CPU，是可穿戴设备、物联网及富嵌入式应用的理想选择;而且尤其适合需要使用Linux等平台操作系统的应用。

　　Cortex-A32 产品介绍

　　Cortex-A32是ARM架构中独一无二的产品，拥有重要地位。Cortex-A32基于ARMv8-A架构，却是针对32位设计的处理器。图2介绍了Cortex-A32与ARMv8-A架构的匹配程度，并与Cortex-A35进行了对比。

QQ截图20160818134149.png

　　图2 - Cortex-A32和ARMv8-A

　　基于上述，Cortex-A35可以实现两种执行态，分别为32位AArch32及64位AArch64，从而充分发挥ARMv8-A架构的64位操作能力;相对比，Cortex-A32仅支持32位AArch32执行态，这一决定不仅进一步压缩产品面积，对于不需要64位操作能力的用例，还可以带来显著的功耗优化。无可否认，部分嵌入式应用可以从64位获益;但许多其他应用都是32位的，将来很长一段时间市场也会依旧如此。Cortex-A32则专为这些应用程序量身打造。

　　AArch32执行态是早期Cortex-A处理器所用ARMv7-A架构的升级版。尽管不具备64位功能，但在其它某些功能却得到显著增强，使Cortex-A32与Cortex-A7和Cortex-A5相比更加高效;对基于更早ARM处理器的设计演变，或聚焦嵌入式市场的全新设计来说，都是理想的选择。

　　对比ARMv7-A，AArch32在如下方面得到强化：

　　· 添加多项新指令，密码函数性能提高

　　· 全新的负载获取及存储释放(Load Acquire and Store Release)指令，让访存排序更高效，与全新C++11访存排序语义匹配

　　· 额外的标量和单指令多数据结构(SIMD)浮点指令

　　· 更丰富的系统控制指令

　　对比早期的32位ARMv7-A处理器，Arrch32这些额外特性使其具备更佳的性能。

　　Cortex-A32总线接口上的高级一致性扩展(Advanced Coherency Extensions，ACE)使其可以利用Cortex-A32构建支持完全一致的多处理器系统，按需升级，以实现更高的性能。不过，如果产品面积与功耗是最主要的限制因素，Cortex-A32也提供专门针对单处理器应用优化的版本，移除一致性逻辑，实现更高功效。

　　经过大物理地址扩展(Large Physical Address Extension，LPAE)，Cortex-A32的可寻址内存空间得到扩展，超过Cortex-A5的32位(4GB)，达到40位物理地址空间。

　　核心本身配置了额外的高级功能，进一步提高效率。其中包括更灵活的功耗管理、更优化的电源域和保留电源门控(retention power gating)的延伸使用(。

　　架构对比

　　ARMv7-M 主要特性

　　ARM Cortex-M处理器基于ARMv7-M架构(Cortex-M0和Cortex-M0+ 采用类似的ARMv6-M架构)。虽然与早期的ARM架构有众多相似之处，但ARMv7-M经过专门打造，更适合深度嵌入、低成本的实时微处理器应用。因此，早期架构的很多功能被删除，并添加了新的特性，以构建更符合“微控制器”环境的编程模式。

　　对比前代处理器(例如备受欢迎的ARM7TDMI)，变化具体如下：

　　操作模式数量显著减少，从7种甚至更多减至2种：仅保留处理器模式与线程模式。其中一种模式(处理器模式)可以默认为优先采用。

　　寄存器文件简化。虽然编程器可用的寄存器数量实质上仍然是16个，但前代架构使用的分组寄存器机制明显减少，因此两种操作模式寄存的只有栈指针(r13)。是否使用寄存拷贝可自行设置。

　　异常模式的变化最为明显。由于典型的微控制器应用可能会出现大量的芯片外设中断，基于此，全新架构中的所有Cortex-M核心都配置了标准嵌套中断向量控制器(Nested Vectored Interrupt Controller，NVIC)。类似的，根据记载处理器地址的向量表，异常处理模式也被标准化。上下文保存和恢复操作完全在硬件中实现，进一步简化编写中断处理器的软件任务。基于上述，实现过程中的干扰性延迟发生几率被降到极低，且高度可预测。

　　与前代ARM处理器类似，ARMv7-M定义了可选内存保护架构。同时，因为裸金属系统或在实时操作系统(RTOS)下运行的系统通常不需要虚拟内存，ARMv7-M并不为其提供支持。

　　为协助实时操作系统(RTOS)的实现和移植，一些标准的片上外围设备也在架构中获得定义，例如SysTick timer。

　　为进一步缩小处理器核心面积，ARMv7-M处理器仅采用Thumb指令集(包括Thumb-2指令集扩展)。

　　ARMv8-A AArch32 主要特性

　　Cortex-A处理器基于ARMv7-A或ARMv8-A架构。ARMv8-A处理器支持AArch32执行态，是32位ARMv7-A架构的兼容升级。这些架构的设计添加了专属特性，比如虚拟内存环境，以支持包括Linux、Android、Windows等的平台操作系统。

　　对比Cortex-M处理器核心，Cortex-A独特之处包括：

　　拥有7种或更多操作模式：用户、管理器、IRQ、FIQ、未定义、中止、系统。每种模式都可以处理一项具体事件，例如，IRQ模式被用于处理IRQ中断。AArch32还支持另外两种模式：Hyp 和监视器，这两种模式分别用于虚拟化及ARM TrustZone。

　　虽然可以使用的寄存器数量同样是16个，但AArch32有许多与上述操作模式相对应的“分组”(banked)寄存器。一旦进入特定操作模式，这些寄存器就会取代对应的用户模式。这使异常处理的许多方面得到简化，但也意味着需要提高机器管理能力，并在初始化上花更大的功夫。

　　异常模式有显著差别，与最初的ARM架构设备一脉相承。具体来说，向量表是由一组可执行的指令组成，而不是地址，并且保存和恢复上下文的任务几乎完全由编程器承担。

　　还有一个重要差别是内存管理单元(Memory Management Unit ，MMU)，内存管理单元会编译核心提交的虚拟地址以及存储系统需要的物理地址。针对Linux一样的平台操作系统所使用的完整需求分页虚拟存储器环境，Cortex-A也可以提供支持。

　　ARMv7-M 与 AArch32 的不同之处

　　从基于Cortex-M处理器的系统迁移到基于Cortex-A32处理器的系统时，许多新特性也有必要了解。

　　尽管这两种架构之间有许多相似之处(如寄存器组和指令集存在多种共性)，但仍然需要清楚一点，ARMv8-A架构在AArch32执行态下的许多特性是基于早期架构的。

　　本节将详细介绍AArch32的特性。这些特性在ARMv7-M中不具备，或者实现方式极其不同。

　　操作模式

　　如图3所示，ARMv7-M仅定义两种操作模式，线程模式与处理器模式。处理器模式可以设置为普通模式，也就是说，在不需要时，软件可以不启用该特性。处理器模式主要被用于处理异常情况，线性模式则用于用户进程。模式间的转化基本上是自动的，发生条件如图所示。如异常情况发生，处理器模式自动启用，异常处理完成后，处理器模式自动退出。SVCall指令是软件进入处理器模式的主要方法(将启动的IRQ设定为未决，可令处理器执行异常操作)。

　　对比图4，图3显示的是AArch32执行态下支持的操作模式。基本的操作模式有七种，其中五种用于处理特定异常。如发生快速中断(Fast Interrupt，FIQ)异常，则会进入FIQ模式;如出现未定义指令，则进入Undef模式，诸如此类。

　　模式间的转换通常自动执行，但是如果在现程序状态寄存器(Current Program Status Register，CPSR)中写入模式字段，则可完全由软件控制进行模式转换，具体细节稍后再做说明。与SVCall指令类似，SVC指令可以支持软件处理SVC异常，并进入SVC模式。

　　AArch32还支持其他两种模式，但未在图中显示(仅为节省版面空间)。它们分别是Hyp模式(用于管理程序)和监控模式(用于TrustZone)。由于内容复杂，本文件暂不涉及。

QQ截图20160818134202.png