当前位置:首页 > AI > 正文内容

ZYNQ7010在PYNQ环境下使用NPU加速神经网络推理

chanra1n3年前 (2022-03-20)AI5669

步骤一、链接ssh并上传NPU SDK

 image.png

步骤二、插入NPU,并给NPU赋予权限

sudo chmod 666 /dev/sg*

步骤三、修改最大字节数

find /sys/devices/ -name max_sectors -exec sh -c 'echo 2048 > "$1"' _ {} \;

步骤四、安装依赖

sudo apt-get update && sudo apt-get install libgtk2.0-dev libjpeg-dev python-numpy python-tk python-opencv python-pip -y

步骤五、解压SDK并生效环境

tar -xvf GTISDK-Linux_armv7l_v4.5.1.0.tar.gz && cd GTISDK-Linux_armv7l_v4.5.1.0 && source SourceMe.env

期间遇到Do you wish to install xx?就输入y按Enter

image.png

步骤六、编译Demo

 cd Apps/Demo/ && make

步骤七、运行Demo

./demo slideshow ../Models/2801/gti_gnet3_fc20_2801.model ../Data/Image_bmp_c20/

运行效果

image.png

平均每张图片推理花费55ms,FPS能达到接近20,这是因为ZYNQ7000系列USB接口是2.0协议,NPU的性能不能完全发挥。

注:这里更正一下,ZYNQ上部署NPU没有达到满性能的原因不只是USB协议,NPU主要加速的是卷积和池化,全连接是在CPU端进行的,所以这也是一部分局限的因素,具体后面我会测试,


附加步骤:

export DISPLAY=192.168.0.102:1.0

修改成你的电脑的xserver显示值,可以实现图片显示。

image.pngimage.pngimage.png

扫描二维码推送至手机访问。

版权声明:本文由我的FPGA发布,如需转载请注明出处。

本文链接:https://www.myfpga.cn/index.php/post/237.html

分享给朋友:

“ZYNQ7010在PYNQ环境下使用NPU加速神经网络推理” 的相关文章

基于M5Stack的UnitV2实现的口罩检测系统(边缘计算+上位机+网站前后端)

基于M5Stack的UnitV2实现的口罩检测系统(边缘计算+上位机+网站前后端)

硬件介绍及实现的功能    本项目实现了一个口罩检测的系统,采用M5Stack提供的M5Stack UnitV2设备,并以该设备为核心。UnitV2设备以Sigmstar SSD202D为核心,通过GC2145摄像头采集图像信息,使用OpenCV和腾讯的开源N...

玩客云安装Armbian基于PaddleLite实现图片分类和目标检查 Cortex-A5等其他可参考

玩客云安装Armbian基于PaddleLite实现图片分类和目标检查 Cortex-A5等其他可参考

本教程为本站原创,转载请注明本网站链接,否则视为侵权!如果朋友还没有安装Armbian,或者怎么折腾也折腾不好,请直接翻到文章最后下载img文件!教程中碰到出错的地方,可以重复运行代码尝试!其他的ArmV7 32位的也可以参考本文,图片分类速度:1.1帧/秒,每张图片耗时约900ms,生产用途应该是...

基于CycloneV使用Paddle Lite,并分别使用单独HPS和FPGA加速对比效果。

基于CycloneV使用Paddle Lite,并分别使用单独HPS和FPGA加速对比效果。

第一部分、仅使用HPS进行计算第一步、通过ssh链接至开发板第二步、解决apt-get存在的问题chmod 644 /usr/lib/sudo/sudoers.so && chown -R root /usr/li...

(原创)联合网页图片爬虫和PaddlePaddle,对图片进行爬取并分类

(原创)联合网页图片爬虫和PaddlePaddle,对图片进行爬取并分类

#首先是Python语言的测试代码,如需服务端部署,请见文末。 import os import time import argparse import requests import re import io from&nb...

(仅供娱乐)基于FFmpeg和PaddleX实现视频分类

(仅供娱乐)基于FFmpeg和PaddleX实现视频分类

代码是一个视频分类程序,它使用PaddleX框架中的深度学习模型对视频截图进行分类推理,并将分类结果应用于视频分类。它的工作流程是:导入必要的Python库:os、shlex、subprocess、shutil、paddlex、cv2、defaultdict。设置调试模式:DEBUG_MODE =...