作者: Eleanor Hecks Designerly 杂志主编
人工智能正推动对更快、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端进行处理已不再现实。此时,边缘计算中的人工智能加速器便显得不可或缺。
这种专用硬件可直接在边缘提升人工智能应用的性能。边缘计算中存在多种类型的人工智能加速器,每种都有其独特的优势、局限性和应用场景。
人工智能加速器在边缘计算中的作用
人工智能的采用正迅速扩展至各行各业,但要满足实时决策和数据隐私的需求,需要更快速、本地化的数据处理能力。云计算因多种原因无法满足这一需求。
首先,设备与云服务器之间传输大量数据需要时间。即使使用高速网络,这种往返传输也会引入延迟,可能导致关键性延误。
其次,带宽不足和成本问题可能带来挑战,尤其是在连接更多智能设备的情况下。将海量数据流传输到云端进行处理往往不切实际或成本过高。这在远程或基础设施有限的环境中尤为明显,因为这些环境的连接性不可靠。
最后,安全和隐私问题使得通过网络传输敏感信息存在风险。国防、医疗和金融等行业要求数据尽可能在源头附近处理,以最小化暴露风险并确保合规性。
这就是AI加速器作为解决方案发挥作用的地方。这些处理器将AI能力直接带到边缘,使设备能够在毫秒内处理信息,无需依赖云端。这意味着它们能够实现即时、智能的行动,使AI应用能够在更大规模上运行。
边缘计算的5种AI加速器
AI加速器在多个方面存在差异。应用场景、行业需求及性能要求决定了不同类型的硬件在边缘计算中的高效应用。部分加速器是处理机器学习模型的强大处理器,而另一些则是专为简单AI任务设计的超高效芯片。每种加速器在提升边缘计算速度、智能性和响应性方面扮演着不同角色。
以下五种是最常用于推动边缘创新的加速器。
1. 神经处理单元(NPUs)
NPUs最适合处理神经网络计算,尤其在机器学习推理任务中。深度学习模型需要大规模并行处理,而NPUs能够通过将神经网络的不同部分分配到多个核心来实现这一点。这种模型并行性与人工神经网络的架构高度契合,使NPUs能够高效处理算法。
NPU内置了常见AI操作的专用电路,如激活函数、池化及特征提取。这些硬件加速器可缩短处理时间并降低能耗。此外,它们通过内存缓冲区确保数据在内存与计算单元间顺畅流动。
典型应用:
l 安全系统中的面部识别
l 智能助手中的语音与语言处理
l 自动驾驶车辆中的物体与行人检测
2. 图形处理单元(GPUs) (GPUs)
GPU最初用于加速图像和视频的图形渲染。然而,它们现在能够处理需要并行数据处理的应用程序,这对于在边缘运行各种AI工作负载至关重要。
GPU的架构由数百到数千个小型处理核心组成。例如,Nvidia RTX 3090拥有10,496个计算统一设备架构核心,采用单指令多线程模型。这使得同一条指令可作用于多个线程,大幅提升吞吐量。不过,GPU也存在权衡取舍:它们功耗较高,且在处理轻量级AI任务时效率较低。
常见应用场景:
l 工业自动化中的实时质量控制
l 自主无人机与机器人导航
l 智能城市基础设施中的边缘分析
3. 数字信号处理器(DSP)
DSP 是专为音频、视频和信号处理优化的专用微处理器。它们能够处理连续数据流,因此最适合在边缘运行通信系统和多媒体设备。其硬件在执行重复性数学运算(如快速傅里叶变换、滤波和矩阵乘法)方面表现卓越。这种架构可实现极低延迟和更低功耗,因此最适合高响应性环境。
例如,远程工作必须具备流畅的视频会议和实时协作功能,以保持员工的连接性。DSP(数字信号处理器)可以通过本地提供高速音频和视频处理来承担这一责任。数据显示,90%的人力资源主管允许远程工作,DSP可以满足数字工作者对强大边缘计算解决方案日益增长的需求。
常见应用:
l 智能设备中的语音识别和降噪
l 流媒体的实时音频和视频处理
l 边缘的电信和多媒体传输
4. 可编程门阵列(FPGAs)
FPGAs是可重新配置的集成电路,开发人员可以编程使其执行特定的计算任务。它们使用可配置的逻辑块、互连和内存阵列,可以定制以执行低延迟的算法。借助FPGAs,开发人员可以适应新的应用需求而无需更换任何组件。
工程师在需要响应性和确定性过程时也会使用FPGA。它们在处理海量数据流的同时保持低功耗,因此非常适合机器视觉等时间敏感任务。
常见应用:
l 航空航天和国防系统中的实时传感器数据处理
l 工业机器人中的自适应人工智能控制
l 用于快速威胁检测和响应的网络安全硬件
5. 人工智能增强型微控制器
人工智能增强型微控制器是超低功耗计算单元,可在资源受限设备上运行轻量级人工智能任务。这些微控制器具备处理简单机器学习模型的硬件,可本地处理数据。在微控制器上直接运行推理任务的功耗可低至5毫瓦,而通过蜂窝网络将数据传输到云端的功耗则高达800毫瓦。如此低的功耗使人工智能微控制器成为电池供电设备的理想解决方案。
AI微控制器适用于计算需求低且对功耗和尺寸有严格限制的边缘环境。例如,可穿戴健康监测设备利用微控制器处理传感器数据,以提供即时反馈并延长电池寿命。尽管它们无法处理复杂的AI模型或高数据流,但这些AI加速器在智能设备中正变得越来越重要。
常见应用:
l 可穿戴健康与健身设备
l 智能家居系统
l 环境物联网传感器(用于监测温度、湿度或空气质量)
赋能边缘AI的未来
AI加速器在实现更快、更高效的处理方面正变得愈发重要。然而,不同类型的加速器适用于特定任务和行业应用,因此选择合适的加速器是提升性能的关键。简而言之,AI加速器已重塑边缘计算,并将成为未来就绪型应用不可或缺的核心组件。 (译自Embedded Computing Design)
