往年的STM32技术研讨会都在全国范围内巡展,AG客户端作为ST官方合作伙伴全程参与会议,并展出了STM32MP1系列CPU模组产品。2022年7月18日-22日,STM32中国技术分享会采用创新的形式在线上跟粉丝们见面。届时,AG客户端也将亮相技术狂欢周,展示STM32MP1系列的CPU模组和demo,并有AG客户端嵌入式工程师与粉丝们进行实时答疑,与您共赴这场夏日狂欢的嵌入式盛会。
👇👇👇长按图片扫码即可进入盛会链接
在STM32诞生15周年之际,意法半导体将首次举办 “STM32中国线上技术周”。通过本次线上技术大会,意法半导体将展示STM32嵌入式技术创新和生态,同时带来意法半导体工业、汽车等更广泛领域的产品演示以及技术解决方案,向观众展示ST更全面的生态系统战略,官方活动扫码进入。
128
2022年7月18日-22日,盛会在即,敬请期待,AG客户端STM32MP1系列CPU模组产品抢先看!AG客户端产品展出时间(7月22日下午13点)。
对于工程师、创客或者电子爱好者来说,开发板是评估验证和实现创意的重要平台,随着各种新奇应用的诞生,目前市面上开发板的总类也愈加丰富和多元化,比如可用于深度学习的 FPGA 开发板、实现边缘加速的 AI 开发板、轻松几步就可连接智能家居控制的 IoT 开发板、可以当编程教育的单板计算机、用于基础学习的微控制器开发板等等。
一款合适的开发板,一个适合它的玩家,两者相遇如干材遇烈火,迸发无限项目创意。与非网总结 2020 年开发板的流行指数,分别推荐给国内工程师、创客、电子爱好者等网友 5 款 2021 年值得一试的开发板。
Teensy 4.0-性能爆表的微控制器开发板
开发板参数
ARM Cortex-M7 的频率为 600 MHz
1024K RAM
2048K 闪存(64K 保留用于恢复和 EEPROM 仿真)
2 个 USB 全速端口
3 个 CAN 总线(1 个带 CAN FD)
2 个 I2S 数字音频
1 个 S / PDIF 数字音频
1 个 SDIO(4 位)原生 SD
3 个 SPI,全部带 16 字 FIFO
3 个 I2C,全部带 4 字节 FIFO
7 个串口,全部带 4 字节 FIFO
32 个通用 DMA 通道
31 个 PWM 引脚
40 个数字引脚,都具有中断功能
14 个模拟引脚,芯片上有 2 个 ADC
加密加速器
随机数发生器
RTC
可编程的 FlexIO
像素处理管道
外围交叉触发
电源管理
Teensy 4.0 可以说是目前市面上性能最高的微控制器开发板之一,板载基于 ARM Cortex-M7 处理器的 NXP i.MX RT1062 微控制器,可以支持 600 MHz 的频率运行,并且只需要 100 mA 左右的电流。不止于此,Teensy 4.0 也支持动态时钟,可以超频至 600 MHz 以上!
优点
性能无疑是 Teensy 4.0 主要优点之一,在实际测试中表明,Teensy 4.0 的代码执行能力比 Teensy 3.6 快 5 倍以上,并且比 Teensy 3.2 快 15 倍。此外,它还具有诸多“高能”外设,如两个 480 Mbps USB 接口,3 个数字音频接口,3 个 CAN 总线和多个串行接口。
缺点
相比一般的微控制器板,200 左右人民币的价格对于外设不算丰富的 Teensy 4.0 来说不太友好。
Teensy 4.0 是 IoT 项目(例如音频合成和分析)的理想选择。尤其对于已经从事过一些物联网项目的工程师来说,配合 Arduino IDE 使用 Teensy 4.0 构建项目不费吹灰之力。
ODROID C4-号称“碾压”树莓派的单板计算机
图源 | amazon.com
ODROID C4 采用与树莓派相同的尺寸设计,并搭载效能更高的 Amlogic S905X3 SoC,具有 4 个最高主频为 2GHz 以上的 Arm Cortex-A55 处理器核心,采用 ARMv8-A 架构并支持 Neon 与 Crypto 延伸指令集,内建具有 4 个运算单元且主频高达 650MHz 的 Mali-G31MP 图形处理器,支持 OpenGL ES 1.1/2.0/3.0、Vulkan 1.0、OpenCL 2.0 等 API,存储部分则搭载容量为 4GB 的 DDR4。
在 I/O 口部分,Odroid C4 提供 4 组 USB 3.2 Gen1,以及 USB 2.0 OTG、千兆太网路、HDMI 2.0、Debug Serial(UART)各 1 组,此外它还具有 40Pin GPIO 扩展接口,提供 SPI、UART、I2C、PWM、ADC、GPIO、DC 5V、DC 3.3V、DC 1.8V 等功能,并可透过 7 Pin 音频扩展接口增加 SPDIF、I2S 等功能。
在系统方面,ODROID C4 可以支持主流的 Android、Ubuntu、CoreELEC 等操作系统。
与树莓派 4 的 CPU 性能对比
与树莓派 4 的 GPU 性能对比
与树莓派 4 的存储性能对比
ODROID C4 比树莓派快得多,特别是树莓派 4 之前。另外,ODROID C4 还带有巨大的散热器,这是另一个很大的优势。
问答题
ODROID C4开发板的缺点?
ODROID C4 价格比较贵,使得树莓派更具有性价比;且树莓派 4 还支持板载蓝牙和WiFi。实际使用中,其不能像树莓派一样拥有软件和社区支持。因此,树莓派 4 依旧是最值得入手的单板计算机。
有许多项目可以与 ODROID C4 开发板一起使用,比如设计用于游戏机的数码相框,将环境传感器集成到娱乐系统和游戏套件组合中,对于许多需要高解析力的图像编码应用,ODROID C4 的用武之地绝对够精准。
Particle Boron-具有蜂窝功能的物联网开发板
图源 | Adafruit Industries
Particle Boron 是一款功能丰富的蜂窝式开发套件,可以通过一个蜂窝服务将网状网络连接到一个蜂窝服务上,开发板本身也可以充当一个独立的蜂窝热点或网关。
Particle Boron 基于 Nordic nRF52840 和 u-blox SARA U201(2G / 3G)模块,内置电池充电电路,具有 20 个混合信号 GPIO 口,易于连接传感器等其它电子设备,Boron 也可以将现有的项目连接到云端,可以作为网关连接缺少或者不稳定的 WiFi 本地网络。
优点
Particle Boron 相对于 Particle Electron 的最大优势在于可以通过 WiFi 相互通信,然后将信息传递到远离蜂窝网络的中央站。此外,除了提供如排针,LiPo 连接器和按钮之类的基本功能外,Boron 价格也比较便宜友好。
缺点
Particle Boron 所涉及到的资料都是英文,对英文基础较差的工程师不太友好。
Particle Boron 可以用于连接整个缺少 WiFi 或不可靠的本地端点网关的不错选择,同时也是将项目连接到 Particle 设备云的理想选择之一。
NVIDIA Jetson TX2 开发板--无可匹敌的边缘 AI 加速器
图源 | Android Central
NVIDIA Jetson TX2 可以说是款精致小巧,功能强大的边缘 AI 加速板,它可以并行运行多个神经网络以用于图像分类,目标检测,分割和语音处理等应用,功耗也仅为 7.5 瓦。
开发板支持 NVIDIA JetPack,其中包括板级支持软件包(BSP),Linux OS,NVIDIACUDA,cuDNN 和 TensorRT 软件库,用于深度学习,计算机视觉,GPU 计算,多媒体处理等等。另一方面,NVIDIA JetPack 可通过 MicroSD 卡映像来使用,上手简单方便。而最重要的是,整个 NVIDIA Jetson 系列产品都使用相同的 JetPack SDK,因此可以与 NVIDIA 所有的 AI 平台完全兼容,用于训练和部署 AI 软件,这大大降低了不同产品间的兼容问题,也让开发者无难度的使用。
优点
Jetson TX2 是一个提供 GPU 加速并行处理的 AI 计算平台,基于 NVIDIA Pascal 架构的 GPU:完全支持所有现代图形 API,统一着色器并支持 GPU 计算。GPU 支持与 NVIDIA 独立 GPU 相同的所有功能,包括广泛的计算 API 和包括 CUDA 在内的库。
另外,NVIDIA 有一个名为 Jetson Inference 的开源项目,它可以在所有 Jetson 平台上运行。Jetson Interference 演示了各种机器学习技术,例如目标识别和目标检测,对于希望构建真实世界机器学习项目的开发人员而言,Jetson TX2 独一无二,理想的选择开端。
缺点
虽然 Jetson TX2 硬件性能强大,但在软件端需要更好的支持。另一个问题是价格,2000 多人民币的价格让人望而生畏,比树莓派 4 等单板计算机要贵得多。
Jetson TX2 项目应用专而广,比如智能视频分析(IVA),无人机,机器人,虚拟现实(VR),增强现实(AR)和便携式医疗设备等领域。除此之外,也可以用于开发许多小型低功耗人工智能系统。而当涉及嵌入式物联网应用时,它也很受欢迎,包括入门级网络视频录像机,家用机器人和具有完整分析功能的智能网关。
AI BOX FZ5-AI&FPGA 交融互补的万金油开发盒子
AI BOX FZ5 是一款AG客户端科技与百度大脑合作的边缘计算盒子,面向批量化 AI 项目落地的原型开发平台。
AI BOX FZ5 核心采用赛灵思 Zynq UltraScale + MPSoC SoC XCZU5EV 系列产品 XCZU5EV-SFVC784,集成了 ARM 四核 Cortex-A53(PS),双核 Cortex-R5(PS),Mali-400 MP2 图形处理单元和 Kintex Ultrascale + FPGA(PL)。自适应可伸缩计算架构,支持二次开发,支持快速模型迭代 4GB/8GB DDR4 SDRAM(64bit,2400MHz)搭配 32GB eMMC 的存储组合,支撑多模型 / 高精度模型部署 支持 DP、USB、HDMI、GigeNet 等丰富接口 支持 8-16 路视频解码,4-8 路智能分析。
优点
四核 Cortex-A53 具有强大的计算能力,双核 Cortex-R5 可用于实时处理应用,Mali-400 MP2 可用于加速图形处理,VCU 可用于硬件视频编解码加速应用,而 FPGA 具有完全可编程性。简直就是一个全能选手,配合丰富且常用的接口以及可扩展接口,可适应各种应用场景。
缺点
价格比较贵,3000 多人民币的价格基本上只有本行业的电子从业者或者公司层面才有真正的购买力需求,对于业余爱好者来说是一笔不小的开销。
AI BOX FZ5 适用于智能安防,工业检测,医疗诊断,无人机巡检,科研, 消费,无人驾驶等广泛领域,如果不考虑成本,是一个真正的万金油产品。
写在最后
以上就是 5 款“性格迥异”的各类别开发板,本文抛砖引玉,这 5 款开发板可能不是最受工程师的追捧,但绝对是值得尝试的。当然如果你还有其它补充的的开发板,请留言告诉AG客户端。
如今,“新基建”相关产业的建设正在全国范围内如火如荼地展开。其中,5G基站建设速度日新月异,大数据、人工智能等新技术方兴未艾,高铁、轨交建设不断下沉到三四线城市,充电桩的规模铺设为新能源汽车铺平道路,特高压电网的架设推动清洁能源在960万平方公里的版图上顺畅调度,工业互联网的部署加速“中国制造”向“中国智造”的转型升级……
在此背景下,企查查日前推出《2020中国新基建大数据分析报告》,将“新基建”的七个主要领域拆分为两大部分进行研究:(1)以5G、人工智能、大数据中心、工业互联网为代表的基于新一代信息技术演化生成的信息基础设施建设;(2)以特高压、新能源汽车充电桩、城际高速铁路和城市轨道交通为代表的深度应用互联网技术支撑传统基础设施转型升级的融合基础设施,对七个领域的企业注册量、地区分布、投融资、专利数量等方面进行一次数据扫描,以期呈现一张全面的“新基建”发展全景数据图谱。
1,5G--近五年注册量翻一番,华为、中兴专利数量领先
数字经济时代,5G网络相较于4G网络有着高速率、大连接数、低时延等优势,能够为信息传输提供快速、灵活、可靠的通信管道,成为“万物皆可连接”的基础,因此5G通常被认为是“新基建”的第一环。
根据2020年中国移动、中国电信和中国联通三大运营商已披露的采购和招标来看,单个5G基站建设成本约16万元, 5G商用规模化单位成本将逐步降低。依据我国4G基站数2014-2019年期间44%的复合增长率,保守估算预测中国5G基站建设未来5年总投资达万亿规模。
近十年来,我国5G行业从平缓发展期进入迅猛增长期。企查查数据显示,2010-2014年,5G相关企业的年新增注册量从1070家到2517家,增幅不过1500家左右。但2015年之后,行业进入迅猛增长期,5年间5G相关企业年新增注册量从2629家增长到5703家,复合增长率达到21.36%,2019年较2015年增长翻一番。
5G产业链主要由上游网络设备、中游网络建设和融合应用、下游终端产品三部分组成。从发射信号的基站,到传输信号的光纤,再到最后的移动终端,我国5G产业链的各环节经由多年积累已初具规模。企查查数据显示,我国目前共有基站相关企业2.14万家,光纤相关企业4.73万家,移动终端相关企业13.7万家。
从国内各企业/机构的5G发明专利数量排名来看,华为以3.35万件专利数量高居榜首,是第二名中兴通讯(1.62万)的两倍还要多,而排名第三的中国电信“仅”有2600余件5G专利数量。此外,中国联通、诺基亚贝尔、国家电网、清华控股、上汽、京信通信、中国移动分列4-10名。
2,人工智能--近五年融资总额近7千亿,三所高校专利数跻身TOP10
人工智能主要包括计算机视觉、语音、自然语言处理等技术,与5G在新基建中的定位类似,也是一种底层基础技术,能够对多个行业进行赋能,应用场景十分广泛,AG客户端将其定位为新基建的“第二环”。
人工智能行业的发展10%在于算法,20%在于技术,70%在于应用场景和落地。如今,人工智能技术在教育、医疗、交通、制造、金融等领域均有所应用,例如人脸识别、机器翻译、无人驾驶、图像识别、工业机器人等,AI技术已逐步深入到居民生活与社会生产的方方面面。
企查查数据显示,我国人工智能相关企业在业/存续21.5万家,其中广东3.03万家,江苏2.89万家,是“唯二”突破了两万家的省份。从城市分布来看,深圳与上海分别拥有人工智能企业1.24万家、1.24万家,在全国所有城市中排名前两位,苏州也以7090家企业数量成为长三角地区的一大产业集群地。
企查查数据显示,2015年-2020 年10月,中国人工智能领域累计发生4462件融资事件,融资金额累计 6968.96 亿元,2015-2017年在融资事件数和融资规模上呈现增长态势, 2018 年起融资事件数量开始回落。2015-2020 年10月,企业单笔融资金额从最初的0.36亿元增长到8.17亿元,资金逐渐流向头部企业的态势明显。
从企业融资阶段来看,人工智能领域获得融资的早期项目居多,集中在 种子 A 轮 ,伴随企业生长周期的演进,市场逐渐成熟,融资阶段也会相应向成长期和成熟期偏移。
从国内企业/机构的人工智能专利数量排名来看,京东方以1.26万排名榜首,腾讯以1.04万的专利数量屈居第二。排名3-5位的分别是哈尔滨工业大学、北京航空航天大学、西安电子科技大学三所高校。如今全球各大高校也纷纷加入大热的AI浪潮之中,为AI的技术研发、人才培养与储备提供坚实力量。此外,百度、海尔、vivo、中国电信、中国联通分列榜单的6-10名。
3,大数据中心--近五年注册量北上广占六成,汽车与医疗领域应用最广
互联网时代,大数据中心已成为社会各行各业发展的重要基础设施,全国不少地区也纷纷引入大数据中心,打造城市数字经济产业区。根据中国信通院发布的《中国数字经济发展白皮书(2020年)》,2019年我国数字经济增加值规模达到35.8万亿元,占GDP比重达到36.2%。
企查查数据显示,2014-2019年期间,我国共成立 356 家数据中心企业,2015 年 109 家数据中心企业成立,2015 年起企业成立数量逐步放缓。2016年成立50家,2017年成立53家,2018年成立34家,2019年仅成立15家。
2015-2020年10月,从区域分布来看,排名前十的地域共成立229家数据中心企业,占全国总量的 87.74%。北京市、广东省、上海市三地成立156家数据中心企业,占全国总量近六成。
2014-2019年,中国数据中心企业累计发生267件融资事件,融资金额累计644.8亿元,2016年融资事件数量达顶峰后逐渐下降,2019年单年融资规模达300亿元。2015-2020年10月,企业单笔融资金额最初从1.09亿元增长到3.27亿元。
2015-2020年10月,从企业融资阶段来看,获得融资数据中心企业阶段呈现两级分化态势:早期和成熟期居多。种子-A+轮的融资事件数占总量约四成,获得战略投资、定向增发、借壳上市、债权融资、并购、IPO的融资数件事占总量约四成。
近年来,大数据技术在很多社会领域都得到了广泛应用,包括金融、教育、交通、医疗、汽车等行业均迎来了数字化的行业变革。企查查数据显示,“大数据+汽车”相关企业数量最多,达到1.44万家,占比19.55%;其次为“大数据+医疗”,总注册量为1.37万家,占比19.35%;此外,“大数据+教育”、“大数据+工业”、“大数据+金融”紧随其后。
从数据中心领域的专利数量排名来看,华为依然高居第一,共有3.35万件发明专利。此外,专利数量超过一万的企业还有三家,分别是中兴通讯(1.62万)、京东方(1.26万)、腾讯(1.04万)。位列榜单5-10位的分别是新华三集团、百度、海尔、中国电信、中国联通、斐讯。
4,工业互联网--相关企业共4.26万家,海尔专利数高居榜首
工业互联网是实现工业数字化、网络化、智能化发展的新型基础设施,是支撑一二三产业、大中小企业融通发展的重要支撑,是促进数字经济和实体经济深度融合的关键依托,是经济高质量发展的重要引擎。
企查查数据显示,我国在业/存续工业互联网相关企业4.26万家,从近10年的趋势来看,2014年是发展转折点。2014年以前,工业互联网相关企业年新增注册量尚不过千,同比增速亦在10%-30%之间;2014年之后,注册量迅速增长,2019年我国工业互联网相关企业新增注册量8318家,2020年1-10月新增注册量更是达到1.7万家,预测未来三年将迎来发展井喷期。
“工业互联网”的重点不仅在“互联网”,更在“工业”。传感器是工业互联网的基础和核心,是自动化智能设备的关键部件,工业互联网的蓬勃发展,将给传感器企业带来巨大的机会。
企查查数据显示,2010-2013年间,传感器相关企业每年新注册量不到2000家,自2014年开始,传感器的应用场景日趋增多,企业注册量直线上升,2014年是我国传感器相关企业增长最快的一年。AG客户端发现,传感器行业与工业互联网的发展基本同频共振,二者属于相辅相成的关系。
在工业互联网领域的专利数量排名中,家电巨头海尔以3206件高居第一,清华控股、烽火通信分别以1475件、1359件排名二三位,紧随其后的是浪潮集团与中国电子信息集团,此外汇川技术、新松机器人、阿里巴巴、宝钢、曙光信息同样跻身TOP10。
5,特高压--水电相关企业超200万家,成为特高压主要承接方
特高压电网在促进我国清洁能源发展中作用巨大。我国清洁能源的蕴藏区域主要集中在西部、北部,清洁能源的需求区域主要集中在经济发达的中东部地区,而特高压输电能够实现清洁能源的大规模、远距离输送。特高压作为电力“新基建”,是“新基建”七大领域中与国计民生关联最为密切的领域。
统计局数据显示,2019年我国发电量构成中火力发电占比72%,是我国最为主流的发电方式;其次是水力发电,占比16%;风电、核电、太阳能发电的占比较小,分别为5%、5%和2%。也就是说,我国发电领域中清洁能源的使用占比不过28%。
企查查数据显示,我国火电相关企业在业存续1.14万家,水电相关企业在业存续216.4万家,风电相关企业在业存续7.29万家。水电相关企业注册量最多,超两百万,年新增注册量也在30-50万左右。特高压更多是对传统电网进行换代升级,水电作为清洁能源的主要组成部分,势必处于主力地位。
据国家电网公开消息,2020年特高压建设项目投资规模将达1811亿元,特高压项目投资规模相比已建成特高压规模比重达40%以上。企查查对特高压产业链进行分析,数据显示电感器相关企业最多,共有1.99万家,组合电器和电抗器分别有7081家和5208家。
6,城际高铁&城市轨交--科技托底,进出口资质企业达4500家
公开数据显示,截至2019年中国铁路运营总里程为13.1万公里,全球排名仅次于美国。总量虽然领先,但城市与城市之间的交通建设仍有很大不足,在国家大力发展城市群建设的背景下,城市与城市之间的互通互联尤为重要,而城际高铁的缺位则会阻碍了城市群发展,因此加强城际高铁和城轨交的建设势在必行。
企查查数据显示,自2013年以后,城际高铁和城市轨交的相关企业注册量开始缓慢爬升,我国城市交通基础建设发展的苗头初显。2013年以前,城际高铁相关企业注册量略高于城市轨交;2013年以后,城市轨交的企业注册量反超城际高铁,并且随着时间的推移有进一步拉大的趋势;2017年城市轨交的企业注册量开始大幅超过城际高铁,直至2019年,城市轨交相关企业达1.2万家,而城际高铁相关企业不过8932家。
从同比增速来看,城际高铁发展增速快于城市轨交,往往前一年城际高铁企业注册量增速攀升,后一年城市轨交的增速就跟了上来。这也符合城市交通规划的现实规律,往往城际高铁规划在前,其后才开始规划城市轨交,讲究的是先外部关联,再内部打通。
7,新能源汽车充电桩--我国公共充电桩55.8万个,位居世界首位
中国新能源汽车产业规模全球领先,产销量连续5年位居世界首位。充电设施的全面铺设成为制约新能源汽车快速推进的最大短板,新基建将充电桩的建设列入其中乃是大势所趋。
根据国家能源局数据,2015-2019年我国公共充电桩保有量从5.78万台增加到51.64万台,车桩比(新能源汽车保有量/充电桩保有量)从2015年的7.84:1增加到2019年的3.50:1,充电设施的密度获得大幅提升。截至2020年6月底,全国各类充电桩保有量达132.2万个,其中公共充电桩55.8万个,数量位居全球首位。
我国充电桩相关企业在近十年里经历了从无到有的巨大变化。企查查数据显示,2014年、2016年充电桩相关企业注册量迎来两次增长高峰,同比增速71.8%、89.7%。2017年充电桩相关企业注册量破万,2019年充电桩相关企业注册量破2万,近年来增速虽有所回落,但增长势头仍锐不可当。
此外,新能源汽车的发展还离不开动力电池、电力系统、车联网等相关细分产业。企查查数据显示,我国动力电池相关企业在业/存续2.19万家,电控系统相关企业在业/存续1.48万家,车联网相关企业在业/存续2.20万家。这些细分产业加上最为关键的短板产业“充电桩”,为我国新能源汽车产业的发展输送源源不断的生命力。
曾被冠以“基建狂魔”称号的中国,过去20年在基础设施领域取得的成就令世界为之侧目。面向未来,预先布局新型基础设施建设,是我国适应新的国际竞争环境而走的关键一步棋。
风物长宜放眼量,随着5G技术继续加码布局,人工智能与大数据的应用范围越来越广泛,新能源汽车为代表的新兴产业持续发力,特高压、城市轨交、工业互联网等领域的深入推进,相信未来的“新基建”必将大放异彩。
在Aspencore全球分析师共同发布的一文中,有一项提到了,HPC数据中心专用加速的趋势递进。其中特别提到英伟达的DPU,这种类型的硬件,几乎可以代表数据中心的某一个发展方向。
这个议题甚至恰好能够解答,英伟达为何要收购Arm,以及AMD为何要收购赛灵思。在近期英伟达GTC China首日主题演讲之后的圆桌论坛上,英伟达全球业务运营执行副总裁Jay Puri谈到了有关英伟达收购Arm的问题。
“Arm已经取得了巨大成功,但他们获得的成功大部分集中在移动端,更多的机会在等待他们探索。Arm应当发挥显著作用的地方,还包括数据中心与PC。但这个市场的涉足其实并不简单,数据中心、云和PC领域是另一回事。”Jay Puri提到,“从技术上来看,Arm在这一领域是完全没问题的。很多探索中的例子都表明,技术不是问题。”
“在市场方面,数据中心未来的重要工作是围绕人工智能、加速计算的。英伟达在这个平台很成熟,AG客户端有可用的完整堆栈,有所有必要的合作伙伴,生态系统庞大,有超过200万开发者;很多初创企业、行业研究都在进行中。”“一旦Arm成为英伟达的一部分,AG客户端将能够促进Arm在数据中心取得成功。”
“这样一来,市场就会有x86之外可行的替代方案,不仅限于移动领域,数据中心、PC等领域都如此。竞争能够促进进步、推动创新。”这番话实则已经非常明晰地交代了,Arm对于英伟达的主要价值在哪里:数据中心(和可能的PC)。本文尝试扩展HPC数据中心的专用加速趋势这一话题,亦可从中看看英伟达的野心有多大。
2020年,HPC领域在相关芯片架构层面发生过一件大事:富士通(Fujitsu)发布名为富岳(Fugaku)的超算,其中的芯片为A64FX。这颗芯片在微架构层面其实是很有意思的。首先它整体上采用monolithic的设计,而不是现在流行的chiplet(比如AMD Epyc)。它既像CPU,又有点儿像GPU,而且片上还集成了HBM2存储——这样一来,A64FX的板卡就比较奇特:板卡上没有RAM,因为已经集成在了片上(chip level)。
AG客户端来简单看看这颗芯片微架构的独特之处。从上面这张图来看,核心周围的4个die就是HBM2存储,连接到四个HBM2 Interface之上,算是与核心靠得很近了,所以主内存到L2 cache的带宽就会比一般的HPC系统要明显更大(1024GB/s),单芯片的容量也达到了32GiB。
核心部分,A64FX整体上是基于Arm v8.2A架构的,扩展了SVE(Scalable Vector Extensions)——这种扩展是专门针对HPC科学负载矢量化准备的,属于NEON扩展指令集的补充。A64FX具体采用的是512bit SVE。这一点其实并没有什么。
这颗芯片真正有意思的地方是,它并没有什么加速器,die上也没有集成专门的GPU之类的处理器。其行为方式很像GPU,但却是颗实实在在的通用CPU。A64FX内部总共分成4组,分别是4个CMG(core memory group),每组13个核心(所以总共是52个核心,其中48个是活跃核心,其余4个为OS以及冗余策略预留)。CMG内部每个核心依次连接,而不同CMG之间采用类似于Intel Skylake的那种Ring Bus环形总线连接。作为一颗通用处理器,A64FX就是可以跑常规操作系统的,虽然它内部看起来还挺像英伟达的GPU。
这颗芯片在设计上就是为HPC负载准备的,尤其是科学模拟、数据分析等。现在比较主流的方案,是用GPU来加速这些活儿,主要是因为GPU能够灌入大量数据,并做高度并行计算,然后同时输出大量结果。事实上,HPC的存储带宽需求一直很大,包括气象模拟、各种流体力学、量子力学等研究,以及计算机视觉、机器学习一类数据分析工作,都要求大量数据的迁移,在大量核心之间通讯、共享。
A64FX从设计思路上,也能干这样的工作:持续做SIMD计算,而且还有不小的片上存储资源和相当大的传输带宽。另外富士通开发了一种名为“Tofu”的互联方案,据说在能效、带宽和延迟方面表现都非常好,宣传上提到是显著优于AMD和Intel的方案的(据说是比Xeon/Epic,有10倍的能效优势)。此外,SVE矢量扩展,及其对FP16、FP32等数据类型计算的原生支持,都令其相当适用于HPC负载。
从已公开的数据来看,A64FX单芯片在性能上也远优于Intel Xeon Platnium 8168、NEC SX-Aurora这类方案,以及部分测试优于Nvidia上代的Tesla V100。其实相较传统通用CPU的性能优势还是意料之中的。因为A64FX从设计上来看,是明显更偏向专门针对HPC做了"domain-specific"的优化的,与此同时还保有了CPU的通用性。
用简单的话来概括A64FX的思路,它很像把HPC方案中CPU+GPU+RAM的传统组合凝聚到一起,另外也有比较全面的大规模扩展方案。这颗芯片预计2021年会出货给亚马逊、谷歌、微软这些云供应商。
当然不能就性能、效率,以及其设计就简单认定,A64FX就一定能够在HPC领域掀起多大的浪,生态构建也属于重要的工作。但很显然,Arm在HPC、数据中心之上发光发热,至少就技术、性能层面来看,是没有任何问题的;而且Arm具备了相当的弹性,是x86平台可能无法给予的;另一方面,Arm在端侧正在对x86发起新一轮猛攻,这可能也将有助于Arm在数据中心的生态构建。
富岳以及A64FX的发展思路未必就代表了数据中心的未来,电子科技及半导体领域从来不是效率、性能说了算的,而且我个人也觉得A64FX在微架构层面虽然有创新,但它作为一种通用芯片,在专用计算的"domain-specific"这一点上仍然可轻易被超过;比如几个月前,就特别提到了,算力相较A64FX的超越。
老祖宗构建起来的架构,其实很难在短期内被轻松推翻。只不过传统CPU+GPU+RAM的发展方向,本身就在不停发生变化。就好像多年前应该不会有太多人想到,GPU、FPGA加速卡这类硬件可以在数据中心活得这么滋润。
英伟达最伟大的发明,大概就是CUDA和GPGPU了。这将GPU扩展到了更多市场。2016年黄仁勋在GeForce 1080 Ti发布会上提到最多的词还是rendering和graphics;但在2020年GeForce 30系列GPU的发布会上,Graphics这个词被提及的次数却远远少于RT core、AI等。这表明英伟达的GPU市场,早就扩展到了游戏、图形计算之外。
即便AMD刚刚发布的Radeon GPU在性能上将近做到与Ampere架构GeForce的齐头并进,AMD Radeon的市场与英伟达依然是不可同日而语的。
我在中提到,2015-2019年英伟达的营收增长速度之快,令这家公司不像是个已经步入成熟期的企业。这主要是源于GPU在数据中心业务上的风光正盛。而且这个趋势在2020年竟然还在持续,甚至可以用“飙车”来形容。
英伟达数据中心业务云霄飞车般的营收增长
英伟达最新一季(FY2021Q3)的财报显示,公司季度营收47.3亿美元,上涨57%。值得注意的是,其中数据中心业务的营收同比增长达到了162%——而且这还是在持续多年增长之后的持续增长。在谷歌云、微软Azure之后,AWS、Oracle Cloud、阿里云都相继宣布了Nvidia A100可用;选择英伟达平台针对AI相关服务做AI inference越来越多;当然英伟达数据中心业务的强势,也离不开Mellanox在InfiniBand等方面的增长。
相较之下,英伟达游戏业务37%的增速虽然也很亮眼,却在增长性上相形见绌了。专业视觉以及汽车业务的营收下滑,也就显得没那么重要了。去年的分析文章中,我曾大致估算数据中心业务占到英伟达整体营收的1/4,仅次于营收占比过半的游戏业务。今年的情况预计又会发生较大变化。以这种成长速度,数据中心很快就会成为可与其游戏业务相提并论、并驾齐驱的业务了。
这其实很大程度上代表了数据中心市场,GPU这类型的硬件已经占据了多重要的地位。可见市场对于性能和效率的渴求还是疯狂的,何况数据中心市场客观上还受到了新冠疫情的推动。
那么这和Arm又有什么关系呢?
英伟达也在GTC China期间宣布,多家中国顶级云服务提供商及系统制造商采用其A100 Tensor Core GPU。阿里云、百度智能云、滴滴云、腾讯云等云服务提供商都推出了搭载A100的云服务及GPU实例。A100是英伟达这一代Ampere架构,定位在数据中心平台的GPU产品,被英伟达称作“最强性能的端到端AI以及HPC数据中心平台”。
Ampere架构是英伟达在2020年年中正式官宣的。消费端的GeForce 30系列,以及上述A100都可以说是Ampere架构产品。实际上英伟达如今在热推的另一类产品,文首提到的DPU也有Ampere架构GPU的身影:BlueField-2X DPU板卡上就加入了一枚Ampere架构的GPU,用于AI加速。
这里的DPU是相当值得一谈的。抛开Ampere架构不谈,在前两个月的GTC大会上,英伟达正式宣布了BlueField-2/2X DPU(data processing units)的推出。DPU这个概念最早应该是Mellanox提出的。英伟达在新闻稿中提到,DPU采用data-center-infrastructure-on-a-chip架构,“突破性的网络、存储和安全性能”。直译过来,就是芯片上的数据中心基础设施。
本月GTC China期间,好几篇来自英伟达的新闻稿都提到了DPU或相关信息:包括公有云厂商Ucloud基于英伟达的BlueField DPU研发,“并于上半年推出的裸金属物理云1.0产品,通过DPU集成的多核Arm CPU快速将物理云基础架构软件从x86迁移到DPU中”。而且“Ucloud进一步于下半年研发并推出裸金属物理云2.0产品”,其中也包含了BlueField DPU本身的更多特性。
在Mellanox被英伟达收购之前,DPU实际上是Mellanox针对下一代SmartNIC的一个设想,将其networking的技术,和Arm做结合,分担主系统的更多工作,包括软件定义网络、软件定义存储、专用加速引擎等。2019年BlueField产品很低调地发布了。英伟达后续对BlueField-2,也就是DPU二代产品的定位有了进一步的延展。
所以今年发布的其实是二代DPU。BlueField 2芯片本身包含8个Arm Cortex-A72核心,以及两个VLIW加速引擎;然后再加上Mellanox最拿手的针对网络连接的ConnectX-6 DX NIC(网络适配器)。
简单来说,DPU是数据中心的另一个domain-specific加速器,从主CPU分担networking、存储和安全负载。这其实是英伟达在GPU产品于数据中心市场大获成功后的又一步扩张举措。与此同时进一步消除x86 CPU在数据中心的重要性。
用Mellanox的话来说,DPU是将计算功能,与数据靠得更近了(data-centric architecture),取代以前还要把数据专门移到计算所在位置的那种模式(compute-centric architecture)。
更具体地说,BlueField-2相对而言是达成了这个目标的;而BlueField-2X则是在板卡上给DPU再加上了Ampere架构的GPU(和EGX A100好像有点类似)——英伟达称其为AI-powered DPU。此处多加的GPU价值主要是实时的安全分析,包括识别异常流量,加密流量分析,识别恶意行为,以及动态安全组合、自动响应等。
至此,其实英伟达已经有能力将整个系统,包括CPU、NIC、加速器、安全都放到一个SoC上,再搭配自家GPU,基本上是可以无视x86的存在的。从英伟达公布的DPU产品路线图来看,后续还会有BlueField-3和4的问世。
BlueField-3其实是加强版的BlueField-2。而BlueField-4则计划在单芯片性能上就打败现有DPU+GPU的组合。英伟达计划BlueField-4应可提供400 TOPS的AI算力。如此一来,从GPU在数据中心做AI、数据分析及HPC,到如今DPU接管网络、存储、安全等关键任务,以及将来DPU可能把这些加速的活儿都干了。
DSP应用于网络安全的一个例子:当两名开发者使用Omnivers高吞吐流app进行实时的工作时,一台设备是Vmware Cloud Foundation + BlueField-2 DPU,另一台则是传统架构,在遭遇DdoS攻击时,两种架构的CPU占用率对比。右边这台服务器会因为数据包泛红,致工作被打断;而左侧服务器,DPU自己就能够识别并丢弃这些恶意数据包
与此同时,英伟达也推出了配套的DOCA软件栈,就类似于GPU世界的CUDA那样。英伟达这两年一直在宣称自己是家软件公司。那么当为开发者提供SDK,这片市场的空前增长,就像现如今的GPU那样,是为英伟达真正统领数据中心市场的野心所在。
而且英伟达现有的软件开发能力,还能持续为DOCA添砖加瓦,包括SDK扩展支持、各种库的增加:眼见CUDA如此的兴盛即知DPU将来的潜力了。与此相较,媒体渲染的什么黄氏定律(Huang’s Law)都不过是为此服务的营销宣传罢了。
Arm将在此间扮演什么样的角色?回想文首Jay Puri在GTC China首日的圆桌论坛上的发言,是否变得明朗许多?在DPU的版图上,Mellanox早已是英伟达麾下一员,就剩Arm了。想到此处,感觉英特尔在现如今的时代格局下,还真是有点儿“谁都在针对我”的处境。
这或许也能一定程度解释,为何AMD要收购赛灵思。另外,Jay Puri发言中还提到了,Arm理应在PC领域也发光发热,这是否是在暗示,英伟达或许还有在消费市场一搏的打算?
边缘的AI允许通过本地化处理进行实时机器学习,从而实现即时数据处理,详细的安全性和增强的客户体验。同时,许多企业正在寻求将AI推入云端,这可以减少实施障碍,改善知识共享并支持更大的模型。前进的道路在于找到一种利用云和边缘优势的平衡。
集中式云资源通常用于训练深度学习推理模型,因为开发精确模型需要大量数据和计算。生成的模型可以部署在中央云位置,也可以分发到边缘的设备。
边缘AI和云AI相得益彰,并且云资源几乎总是与边缘AI用例有关。在一个完美的世界中,为了简化和扩展,AG客户端将所有工作负载集中在云中,但是,诸如延迟,带宽,自治性,安全性和隐私之类的因素使得必须在靠近数据的边缘部署更多的AI模型。消息来源。一些培训正在边缘进行,并且越来越多地关注联合学习的概念,该概念将处理集中在数据区域,同时集中结果以消除区域偏见。
边缘AI的崛起
更好的网络基础架构和新的边缘计算架构的兴起,正在打破集中式云AI与分布式边缘AI工作负载之间的障碍。
其优势是基础架构的巨大新兴变化,它通过增加分布在世界每个角落的信息技术层来补充云。AG客户端相信边缘AI会引发一场革命,就像云技术获得牵引力一样大。
如果设计得当,Edge AI将为自动缩放带来新的机会,因为每个新用户都会为集体工作负载带来全新的机器。边缘还可以更好地访问更多未处理的原始输入数据,而云AI解决方案必须与预处理的数据一起使用以提高性能或庞大的数据集,这时带宽可能会成为一个严重问题。
将事物移到边缘的原因是为了获得更好的响应时间。速度和延迟对于诸如计算机视觉和用于5G的虚拟无线电接入网络等应用至关重要。另一个重大好处在于,通过限制将哪些数据上传到云来改善隐私。
Edge AI的部署也充满了限制,包括网络延迟,内存压力,电池消耗以及进程可能被用户或操作系统作为后台的可能性。从事边缘AI的开发人员需要计划各种限制,尤其是在探索手机等常见用例时。
互补方法
大多数专家将边缘和云方法视为更大战略的补充部分。云AI更适合批量学习技术,该技术可以处理大数据集以构建更智能的算法,从而快速,大规模地获得最大的准确性。Edge AI可以执行这些模型,而云服务可以从这些模型的性能中学习并应用于基础数据以创建一个连续的学习循环。
保持适当的平衡-如果您完全致力于边缘AI,那么您将失去持续改进模型的能力。没有新的数据流,您将无处利用。但是,如果您完全致力于云AI,则可能会危及数据质量-由于需要进行权衡才能使其可上传,并且缺乏反馈来指导用户捕获更好的数据-或数据量。
边缘AI补充了云AI,可在需要时提供对即时决策的访问,并利用云获得更深入的见解或需要更广泛或更纵向的数据集来推动解决方案的见解。
例如,在连接的汽车中,汽车上的传感器会提供实时数据流,该数据流会不断进行处理并做出决策,例如施加制动器或调整方向盘。可以将相同的传感器数据流式传输到云中以进行长期的模式分析,从而可以警告所有者急需的维修,从而可以防止将来发生事故。另一方面,云AI对边缘AI进行了补充,以推动更深入的见解,调整模型并继续增强他们的见解。
云计算和边缘AI协同工作,以更深入的洞察力为驱动力,制定即时的需求决策,而这些洞察力不断被新的边缘数据所告知。
培训工作流程
使边缘AI和云AI协同工作的主要挑战是程序和体系结构。需要对应用程序进行设计,以便有目的地拆分和协调它们之间的工作量。
例如,启用边缘的摄像头可以处理源自传感器的所有信息,而不会因无关数据而使网络过载。但是,当最终在边缘检测到感兴趣的对象时,可以将相关帧广播到更大的云应用程序,该应用程序可以存储,进一步分析(例如,帧中对象的子类型是什么以及其属性是什么),以及与人类主管共享分析结果。
一种策略在于创建一种在模型和数据的大小与数据传输成本之间取得平衡的体系结构。对于大型模型,留在云中更有意义。有多种方法可以减小模型大小以帮助解决问题,但是,如果要处理非常大的模型,则可能需要在云中运行它。
在其他情况下,当在边缘生成大量数据时,在本地更新模型,然后将其子集反馈到云中以进行进一步优化可能更有意义。在对敏感数据进行推理时,开发人员还需要考虑一些隐私问题。例如,如果开发人员希望通过手机摄像头检测中风的证据,则应用程序可能需要在本地处理数据以确保符合HIPAA。
框架将不断发展,以提供更多有关在哪里进行培训以及如何提高重用性的选择。例如,TensorFlow.js使用WebGL和WebAssembly在浏览器中运行(有益于隐私,低延迟,利用桌面或移动GPU资源等),但也可以加载分片的,缓存的云训练模型版本。模型交换格式(例如,开放神经网络交换)也可以增加模型在不同环境中的流动性。Sletten建议探索像LLVM这样的工具,这是一个开源编译器基础结构项目,以使从应用程序所运行的环境中抽象出应用程序变得更加容易。
需要适应
将更多的AI从云转移到边缘的关键挑战之一是能够在边缘AI芯片中高效运行的神经网络架构。聪明的行车记录仪供应商。
通用计算平台(如在云服务器中找到的平台)可以运行任何网络体系结构。在边缘AI中这变得更加困难。架构和训练有素的模型必须经过修改才能在边缘的AI芯片组上运行。
这是一个巨大的挑战,因为用户可能会从高性能的移动网络驶向盲区,而无论如何都希望获得良好的性能。在推理期间,没有足够的网络带宽将所有数据从边缘移动到云,但是用例要求将本地推理输出进行全局汇总。边缘AI可以运行神经网络,以帮助过滤必须发送到云以进行进一步AI处理的数据。
在其他情况下,云AI训练可能会导致神经网络模型具有过多的层次,无法在边缘设备上有效运行。在这些情况下,边缘AI可以运行较轻的神经网络,从而创建输入的中间表示形式,该中间表示被压缩得更多,因此可以发送到云中以进行进一步的AI处理。在训练期间,边缘和云AI可以以混合模式运行,以提供类似于“虚拟主动学习”的功能,在这种情况下,边缘AI筛选大量数据并“教导”云AI。
边缘AI芯片组中受支持的神经网络架构的类型是有限的,并且通常比在云中可以实现的功能落后几个月。解决这些局限性的一种有用方法是使用编译器工具链和堆栈,例如Apache TVM,它们有助于将模型从一个平台移植到另一个平台。
另一种方法是使用已知可以在边缘AI中很好地工作的网络体系结构,并直接为目标平台训练它们。他发现,鉴于训练数据的数量和种类足够多,就绝对性能而言,这种方法通常可以胜过跨平台编译器方法。但是,它还需要在培训期间以及预处理和后期处理中进行一些手工操作。
边缘和云AI之间的常见折衷
开发人员需要在云和边缘AI之间进行权衡的一些最常见的折衷方案包括:
·处理能力:边缘计算设备通常功能较弱,并且难以更换或升级。
·延迟:云计算速度很快,但尚未为驾车或工业控制等实时应用做好准备。
·能耗:大多数设计人员通常不必像对待边缘那样考虑云的能耗约束。
·连通性:当连通性下降时,像自动驾驶汽车这样的安全关键服务将无法停止工作,这会将实时AI驱动的决策的处理推向边缘。
·安全性:用于驱动身份验证和处理敏感信息(例如指纹或病历)的AI服务通常最好是在本地出于安全考虑而完成。即使部署了非常强大的云安全性,用户从边缘处理中获得更好的隐私感也可能是重要的考虑因素。
导读:充电基础设施建设是“新基建”的重点建设方向。新基建所覆盖的领域主要包括以下七项:5G基站、人工智能、工业互联网、大数据中心、特高压、充电桩以及城际高速和轨道交通。伴随新能源车近年的高速发展,充电桩作为新能源车产业链的重要环节,有望在“新基建”发力下加速发展。
实际上,充电桩不只是独立、物理的存在,背后涉及5G、大数据、工业互联网等新基建领域,智能充电网也是智慧城市的组成部分。其中充电桩计费控制单元作为设备核心部件占据着重要的地位,AG客户端推出的南网/国网充电桩计费控制单元,助力国家“新基建”建设。
充电桩是为电动汽车充电的专用电力设备,由桩体、电气模块、计量模块等部分组成,一般具有电能计量、计费、通信、控制等功能。充电桩主要安装于公共建筑(公共楼宇、商场、公共停车场等)、居民小区停车场或充电站内,输入端与交流电网直接连接,输出端都装有充电插头用于为电动汽车充电。
私人停车场
充电桩内部元器件关系
从结构图上不难看出,计费控制单元通过RS232、RS485、4G/3G、以太网等接口和外部设备进行通信,同时CANBUS与充电设备控制器对外部电气设备进行控制,并且通过LVDS/并口等进行人机交互的界面显示和操作输入。
南网充电桩计费控制单元
MY-EVC3000S-V2
依照南方电网规范要求设计,外围接口资源丰富,实现充电桩人机显示、计量计费、支付、数据加解密、控制充电设备启停;实现本地-充电控制板、远程-运营平台的通信数据交互功能。
一、功能完善,接口丰富
严格依照南方电网规范要求设计,外围接口资源丰富,实现充电桩人机显示、计量计费、支付、数据加解密、控制充电设备启停;实现本地-充电控制板、远程-运营平台的通信数据交互功能。
二、行业标准,快速交付
电气性能符合国家充电桩行业标准,结合南方电网对于充电桩计费控制单元的技术要求,优化接口与成本,无缝接入南方电网多个省局运营平台,协助客户快速实现南网项目交付。
三、工业品质,稳定可靠
MY-EVC3000S-V2采用-40~85℃工业级物料,通过包括信号质量分析、EMC测试、高低温测试、通讯接口软件压力测试、老化拷机等一系列测试,在各种恶劣环境中均可稳定运行。
国网充电桩计费控制单元
MY-EVC3000S-V3
严格依照国家电网规范要求设计,外围接口资源丰富,无缝对接国网协议充电控制板,实现充电桩人机显示、计量计费、支付、数据加解密、控制充电设备启停、与车联网平台通信等功能。
一、方案标准,设计规范
依据《国网电动汽车直流充电设备标准化设计方案》文件中对计费控制单元的软硬件技术要求开发,符合标准化设计方案要求。
二、资深技术,服务到位
利用工控核心板资深行业技术经验与平台资源,计费控制单元产品通过国网电动汽车服务公司试验检测中心检测,产品保证软硬件兼容性,帮助客户搭建、调试国网标准充电桩,顺利通过国网招标验收。
合作客户
定制服务
更多相关产品......
社会充电桩计费控制单元MY-EVC5100S
与国网充电桩无缝切换,可按照客户要求进行“显示界面、充电流程、对接后台”等定制开发,打造您的充电桩品牌。
欢迎向AG客户端销售/客服咨询参加本次研讨会的报名方式,以便获得午餐券。
7月10日, 恩智浦技术日:AIoT 解决方案研讨会将在广州香格里拉大酒店举办。AG客户端电子作为恩智浦官方工程顾问合作伙伴,将在研讨会展区设立AG客户端电子展位。
届时,AG客户端将展出基于NXP i.MX6UL/i.MX6ULL 、i.MX8M、i.MX8M mini系列应用处理器的多款热门产品并附带demo,欢迎广大朋友前来体验。
恩智浦技术日 – AIoT技术研讨会是由行业专家主导的的客户交流会,支持嵌入式工程师加快创新,了解行业的最新动态及各项解决方案的知识要点。
此次免费,为期一天的技术交流会,针对物联网、工业及消费者行业的研发人员、产品市场人员及工程师,提供恩智浦产品最新信息,以及业界领先的解决方案。议题将会围绕着人工智能、物联网主题展开,就恩智浦的各种解决方案进行主题演讲,并与客户进行深入探讨。在下午特设智能锁应用工作坊就智能锁安全等特性与客户进行深入探讨
7月10日:智能家居(网关,智能音响,语音控制),智能工业各种关键应用
7月10日下午:智能锁应用工作坊。
恩智浦技术日: AIoT技术方案研讨会
日期: 2019 年 7月 10 日
地点: 广州香格里拉大酒店
广东省广州市海珠区会展东路1号 邮政编码: 510308