跳转到主要内容

瑞萨电子扩展MCU/MPU产品阵容,满足边缘AI全新处理需求

图像
Daryl Khoo
Daryl Khoo
Vice President of Embedded Processing Marketing Division
Published: August 22, 2025

人工智能(AI)在物联网边缘的应用,正在重新定义互联设备在各类消费与工业场景中采集、处理和分析数据的方式,以实现可执行的决策结果。与需要重点考虑功耗、数据延迟和安全管理的云端AI服务器不同,AIoT将智能处理能力推向数据源头,从而实现实时的现场决策,同时增强隐私保护,并降低能耗。

尽管前景广阔,物联网边缘的AI应用仍面临重大的工程挑战。传统AI模型计算量巨大,需要大量内存和电力支持,这对于资源受限、通常依赖电池供电且处理能力有限的物联网设备而言,难以承受。因此,设计人员亟需高度优化、轻量化的神经网络模型,使其能够在微控制器、微处理器及其它低功耗硬件上高效运行的同时,还不牺牲性能与精度。

图像
Artificial intelligence at the IoT edge is redefining how connected devices capture, process, and analyze data to render actionable outcomes.

利用TinyML模型管理AIoT处理

由于AIoT本质上具有去中心化的特点,不仅降低对云服务器的依赖,还能够即时根据实时分析结果采取行动,并通过将数据保存在本地来增强安全性。这种特性使得为工厂设备配备预测性维护功能变得更加容易:只需将机器学习(ML)模型嵌入到本地传感器中,不必等待云端分析即可检测异常或故障。具备AI增强语音界面的智能家居设备,无需通过网络传送敏感音频数据,即可实现即时关键词识别和自然语言理解。

与AI数据中心领域正在兴起的技术趋势类似,边缘AIoT也在不断发展,以应对推理模型的激增。如果说数据是实现智能、实时决策的“燃料”,那么AI推理就是在边缘设备上直接处理预训练机器学习模型的“引擎”。

数据中心的AI推理建模具有一套独特的计算需求,通常依靠强大的并行处理器来训练拥有数十亿参数的大型语言模型(LLM)。而在另一端,边缘端的AIoT技术(如TinyML)则最小化内存需求与计算开销,使电池供电的物联网终端设备能够实现实时分析。此外,TinyML推理建模还支持多模态应用,融合语音、视觉和传感器数据,应用于环境监测、自主导航等高阶应用场景。

实时数据处理是边缘AIoT面临的另一项关键挑战,其受限于内存容量、有限的能耗预算和散热条件等多重因素。许多消费及工业类应用,如智能家居语音识别和自主传感器,都要求超低延迟响应。但由于网络延迟,基于云的AI难以满足这些要求,因此设备端推理变得至关重要。同时,工程人员还需通过在终端直接嵌入强大的加密和信任根机制,来确保数据安全与隐私。

TinyML等工具在突破这些障碍方面发挥着关键作用:它使得紧凑型机器学习模型能够在物联网硬件上高效运行,同时显著延长电池寿命。

瑞萨推出新型MCU与MPU,专为边缘AIoT优化

为更好地服务于边缘AIoT应用,瑞萨近期拓展了其处理器产品阵容,推出了一系列高性能、低功耗的新型MCU和MPU。这些处理器集成专用神经网络处理单元(NPU),专为AI计算任务量身打造。

32位的瑞萨RA8P1 MCU专为语音和视觉边缘AI应用而设计,配备双Arm®内核——1GHz的Cortex®-M85和250MHz的Cortex-M33——以及一个Arm Ethos-U55 NPU,可提供高达256 GOPS的AI算力。在安全性方面,这款新型MCU支持Arm TrustZone®安全执行环境、硬件信任根、安全启动,以及先进的加密引擎,确保在关键边缘应用中的安全部署。

瑞萨还发布了面向高性能边缘AIoT和人机界面的64位RZ/G3E MPU。该处理器集成了四核Arm Cortex-A55 CPU、Cortex-M33内核以及先进的图形处理功能。RZ/G3E内嵌Arm Ethos-U55 NPU,提供高达512 GOPS的AI算力,可分担主CPU负载,用于图像分类、语音识别和异常检测等任务。

图像
New AIoT MCU/MPU Architectures

Arm NPU精准匹配AIoT的功耗与性能需求

Arm Ethos-U55 NPU支持ResNet、DS-CNN和Mobilenet等流行的神经网络模型,在推理速度上相较纯CPU处理速度提升最高达35倍。与动辄消耗数十乃至数百瓦电力、用于高吞吐量并行计算的GPU不同,Ethos-U55能够在毫瓦级功耗下实现硬件加速推理,使其成为物联网边缘设备的理想选择。

Arm NPU支持压缩和量化的神经网络,从而减少内存与计算开销,实现实时、本地化的AI处理。相比之下,GPU虽在训练大型模型方面表现出色,但因其体积、成本和高功耗,在边缘部署中并不实用。

集成RUHMI框架与e² studio,简化边缘AI开发

瑞萨推出的新款MCU和MPU均得到e² studio集成开发环境的支持,并融合瑞萨的RUHMI框架,以加速边缘AIoT设计。RUHMI(稳健统一异构模型集成)是一套端到端的工具集,也是瑞萨首款面向MCU/MPU的综合性框架,专为简化资源受限设备上的AI工作负载而设计。RUHMI支持TensorFlow Lite、PyTorch和ONNX等主流机器学习(ML)格式,使开发人员能够导入并优化预训练模型,以实现高性能、低功耗的边缘AI部署。

RUHMI框架通过瑞萨e² studio得到了进一步增强,后者带来了直观的工具、丰富的示例应用和强大的调试功能。两者结合使用,可帮助开发人员更轻松地处理图像及音频数据的预处理,在NPU上执行推理,并在统一的环境中对结果进行后处理。

边缘AIoT依赖低功耗、高算力密度处理器

根据Grand View Research的报告,2024年全球边缘AI市场规模已突破200亿美元,预计到2030年将接近665亿美元,主要驱动力来自对网络边缘实时数据处理与分析的强劲需求。

如今,MCU和MPU因其低功耗、本地化处理能力和成本效益,日益成为边缘AIoT视觉与语音应用的首选方案。与依赖云端连接且功耗较高的GPU不同,MCU和MPU可在终端设备本地直接处理数据,实现无网络延迟的实时推理与决策。同时,通过将敏感数据保留在设备端,这些处理器显著提升系统的安全性与隐私保护能力,避免持续的云端通信需求。

这种速度、能效和数据安全的完美结合,使MCU和MPU成为可穿戴设备、智能家居及工业边缘AI系统的理想之选。

图像
AI and IoT Diagram

未来将重点推进高清视觉、安全保障与稳健的物联网供应链建设

在利用高效TinyML模型为处理器生态系统提供恰到好处支持的同时,瑞萨还在开发面向视觉Transformer(Vi-T)网络的MPU。这种深度学习技术将原本为自然语言处理设计的Transformer模型应用于计算机视觉领域,但与高功耗的GPU不同,Vi-T无需冷却风扇即可处理高分辨率图像和视频。

瑞萨还在开发零接触安全解决方案,如后量子密码学(PQC):该方案可抵御来自经典计算机和量子计算机的攻击,从而更好地防御日益增多的网络威胁。

在推动AI加速硬件、软件和工具链开发的同时,瑞萨始终坚持支持传统(非AI)产品以及维护当今众多物联网系统运行的开源软件环境。通过与合作伙伴生态系统紧密合作,我们紧跟快速变化的物联网领域发展步伐,从而帮助客户开发出更具可持续、更智能、更安全可靠的互联系统。