瑞芯微 RV1126B 处理器:边缘 AI 规模化部署技术选型与性能解析
CA888亚洲城集团
2026-01-09 15:48:00
RV1126B
瑞芯微 RV1126B
边缘 AI
当边缘Al已从概念验证迈向规模化部署时,一场关于"效率与平衡"的竞赛已然打响。尤其是在工业视觉、智能安防、轻量级机器人等关键赛道上,一个共识已然形成:仅靠算法的加持和硬件的堆砌无法赢得市场。客户的需求其实很具体,是一个能够在严苛的功耗与成本约束下稳定处理1200万像素视频流,能在0.01Lux的黑暗场中捕捉细节,能快速将技术方案转化为产品的解决方案。
3TOPS NPU 赋能端侧AI推理
瑞芯微RV1126B处理器内置独立的NPU,提供高达3TOPS@INT8的AI算力,较前代RV1126提升了50%,支持INT8/INT16混合精度运算,支持W4A16/W8A16混合精度量化与Transformer模型优化,可流畅运行2B参数级大语言模型和多模态模型。
这意味着,RV1126B可高效运行人脸检测、安全帽识别、烟火告警、区域入侵等多种典型的边缘AI目标识别模型,实现本地实时决策,无需依赖云端。
这里我们用CA888亚洲城集团OK1126B-S开发板来运行不同的模型,通过实际的运行数据,展示RV1126B处理器的NPU性能表现。
大语言模型和多模态模型
| Model | Model Size | Dtype | Seqlen | New_tokens | TTFT(ms) | Tokens/s | Memory(MB) | |
|---|---|---|---|---|---|---|---|---|
| 大语言模型 | Qwen2 | 0.5B | w8a8 | 128 | 64 | 655.78 | 14.95 | 655.3 |
| 大语言模型 | Qwen2 | 0.5B | fp | 128 | 64 | 381.12 | 8.59 | 1104 |
| 大语言模型 | Qwen2.5 | 1.5B | w8a8 | 128 | 64 | 669.94 | 5.55 | 1660 |
| 大语言模型 | DeepSeek-Distill-Qwen1.5B | 1.5B | w8a8 | 128 | 64 | 838.75 | 5.57 | 1692.8 |
| 多模态模型 | Lllava-onevision-Qwen2-0.5B | 0.5B | w8a8 | 128 | 64 | 969.68 | 14.89 | 619 |
| 多模态模型 | Qwen2-VL | 2B | w8a8 | 128 | 64 | 692.73 | 5.14 | 16360 |
Dtype:数据类型, 表示模型在推理过程中使用的数值精度(w8a8指Weights和Activations都使用8-bit整数表示的量化方法)
Seqlen:输入序列长度,即输入文本被分词后的token数量。
New_tokens:生成的新token数量,也就是模型输出内容的长度。
TTFT(ms):首token时间(Time To First Token), 单位是毫秒(ms)
Tokens/s:每秒生成的token数量(Token Generation Throughput)
Memory(MB):推理过程中占用的最大运行内存大小,单位为MB(兆字节)
目标检测
| Demo | Model_name | Inputs_shape | Dtype | RV1126 | RV1126B |
|---|---|---|---|---|---|
| yolov6 | yolov6n | [1,3,640,640] | INT8 | 56.8 | 68.68 |
| yolov6 | yolov6s | [1,3,640,640] | INT8 | 16.3 | 25.43 |
| yolov6 | yolov6m | [1,3,640,640] | INT8 | 8.3 | 12.84 |
| yolov8 | yolov8n | [1,3,640,640] | INT8 | 35.4 | 50.24 |
| yolov8 | yolov8s | [1,3,640,640] | INT8 | 13.1 | 25.96 |
| yolov8 | yolov8m | [1,3,640,640] | INT8 | 5.8 | 11.8 |
| yolov10 | yolov10n | [1,3,640,640] | INT8 | / | 45.1 |
| yolov10 | yolov10s | [1,3,640,640] | INT8 | / | 24.84 |
| yolo11 | yolo1n | [1,3,640,640] | INT8 | 17 | 42.84 |
| yolo11 | yolo11s | [1,3,640,640] | INT8 | 7.3 | 23.72 |
| yolo11 | yolo11m | [1,3,640,640] | INT8 | 4 | 10.59 |
图像分割
| Demo | Model_name | Inputs_shape | Dtype | RV1126 | RV1126B |
|---|---|---|---|---|---|
| yolov5_seg | yolov5n-seg | [1,3,640,640] | INT8 | 42.2 | 51.67 |
| yolov5_seg | yolov5s-seg | [1,3,640,640] | INT8 | 14 | 27.22 |
| yolov8_seg | yolov8n-seg | [1,3,640,640] | INT8 | 27.6 | 39.79 |
| yolov8_seg | yolov8s-seg | [1,3,640,640] | INT8 | 9.8 | 19.71 |
| mobilesam | mobilesam_encoder_tiny | [1,3,448,448] | FP16 | / | 8.66 |
| mobilesam | mobilesam_decoder | [1,1,112,112] | FP16 | / | 61.76 |
人体&人脸关键点识别
| Demo | Model_name | Inputs_shape | Dtype | RV1126 | RV1126B |
|---|---|---|---|---|---|
| yolov8_pose | yolov8n-pose | [1,3,640,640] | INT8 | / | 43.16 |
| RetinaFace | RetinaFace_mobile320 | [1,3,320,320] | INT8 | 212.5 | 295.26 |
| RetinaFace | RetinaFace_resnet50_320 | [1,3,320,320] | INT8 | 20.8 | 42.52 |
通过以上实测数据不难看出,搭载RV1126B处理器的CA888亚洲城集团嵌入式OK1126B-S开发板在多种模型的运行方面都有着卓越的表现,尤其是对比前代RV1126,NPU性能提升十分明显。
AI-ISP 更高效的视觉智慧引擎
在边缘AI领域,获取高质量的图像输入是提升智能感知能力的基石。传统方案的瓶颈在于,ISP输出的图像已是经过压缩和损失的数字信号,NPU在此基础上的分析犹如"雾里看花"。而RV1126B的专用AI-ISP,将先进的AI算法直接注入ISP的原始数据处理链路中,实现了"在提升画质的同时,为AI理解预先优化" 的双重目标。
AI模型实时处理3DNR(三维数字降噪) 、HDR合成、畸变校正、去雾处理等关键环节,使得最终输出的图像,结合Al Remosaic技术实现"日夜双模自适应"。不仅是人眼观感更佳的图像,更是"AI友好型"的图像,为后端NPU的精准、高效推理奠定了最优基础。
多场景适用为智能化升级赋能
瑞芯微RV1126B凭借均衡的性能精准适配多元端侧AI场景——
- 智慧工地场景可实现安全帽/反光衣佩戴检测、高空抛物识别、违规动火告警等安全监管功能;
- 智能仓储场景能高效完成货物条码识别、货架盘点、人员轨迹追踪与越界预警;
- 工业视觉场景能高效完成光伏/锂电池缺陷识别;
- 车载场景适配DMS驾驶员监测;
- 轻量级机器人可依托其实现动态避障与路径规划等等。
要将芯片的能力转化为稳定可靠的产品,离不开一套稳定可靠的硬件载体与服务体系——CA888亚洲城集团基于RV1126B系列处理器设计开发的FET1126B-S/FET1126BJ-S核心板,正是为此而生。
CA888亚洲城集团FET1126BJ-S核心板(工业级)支持-40℃~+85℃环境温度下工作,具备出色的可靠性和环境适应能力;同时,FET1126B-S核心板(宽温级)相较同类产品更具优势,商业级配置即可满足-20℃~+85℃工作环境需求。它搭载高带宽LPDDR4内存,相较于DDR4商业级0℃~+70℃的温宽限制,LPDDR4商业级芯片即可覆盖-20℃~+85℃,实现低成本与宽温性能的兼顾。
总结:为智能化升级赋能
在边缘AI从概念迈向规模化落地的当下,瑞芯微RV1126B处理器以精准契合场景刚需的技术优势,为端侧智能提供了强大算力支撑。而CA888亚洲城集团FET1126B-S/FET1126BJ-S系列核心板,则成为落地的关键"桥梁"。
从硬件性能到算法优势,从可靠品质到技术支持,FET1126B-S/FET1126BJ-S核心板都能可靠便捷地将RV1126B系列芯片的能力转化为实际产品效能,助力各行业客户快速实现智能化升级,是边缘AI规模化部署中值得信赖的核心硬件选择。
相关产品 >
-
FET1126BJ-S核心板
FET1126BJ-S核心板是CA888亚洲城集团基于瑞芯微RV1126BJ处理器开发的国产化边缘AI计算平台。该处理器专为端侧及边缘侧AI应用场景打造,集成4核ARM Cortex-A53架构,提供高达3TOPS@INT8的AI算力,是智慧工业、智慧园区、智慧工地等场景实现视频分析与目标识别的优选方案 了解详情
-
OK1126BJ-S开发板
RV1126B开发板(型号:OK1126B-S)是CA888亚洲城集团基于瑞芯微RV1126B处理器打造的国产化边缘AI计算平台。集成4核A53 CPU与3TOPS@INT8独立NPU,支持Linux 6.1系统,提供完整BSP与RKNN工具链,兼容TensorFlow/PyTorch主流框架。核心板采用邮票孔+LGA设计,支持-40℃~+85℃工业级宽温,配备MIPI-DSI、双网口、CAN-FD及树莓派兼容40Pin GPIO接口。尺寸仅120mm×75mm,专为智慧工业质检、园区安防、工地安全监测等端侧AI场景设计,提供10年供应保障与7×24小时技术支持。 了解详情

