FPGA——HLS入门实践(LED灯闪烁)
一. HLS是什么?与VHDL/Verilog编程技术有什么关系?二. HLS有哪些关键技术问题?目前存在什么技术局限性?三. 在win10(或者Ubuntu系统下)安装 Intel 或者 Xilinx 的支持HLS的FPGA编程开发软件(Quartus18或者Vivado18),设置好环境,完成一个入门级的HLS程序,并进行仿真或者实际开发板运行。
文章目录
前言
实验概述:
一. HLS是什么?与VHDL/Verilog编程技术有什么关系?
二. HLS有哪些关键技术问题?目前存在什么技术局限性?
三. 在win10(或者Ubuntu系统下)安装 Intel 或者 Xilinx 的支持HLS的FPGA编程开发软件(Quartus18或者Vivado18),设置好环境,完成一个入门级的HLS程序,并进行仿真或者实际开发板运行。
一、HLS简介
1.1 HLS简介
HLS(High Level Synthesis)
:一款高层次综合工具。
- 能够将
C/C++
或者system C
等高级语言转化为RTL
(底层硬件描述语言)电路,降低开发时间。 - 提供了常见的库(例如图像处理相关的
OpenCv
库和其
它的数学库)。 - 可以创建IP并通过例化或者使用
BlockDesign
的方式应用到项目中。
转化原理:在前端将 C 语言描述进行分析,然后进行代码层面的优化(code-level transformation),再在后端把这些运算工作进行并行调度(parallelise & schedule),最后生成 RTL 语言。
使用HLS开发流程:
- 第一步
C/C++层面的仿真
:
首先在源文件中,添加一个顶层函数,这个函数就是我们想要将来映射到 RTL 电路中的函数,之后需要一个 C Testbench 来对这个函数功能进行验证,在算法层面,检验我们的函数是否能够正常工作。(算法层面的仿真,能够很快地就得出结果,有助于提高我们的开发效率。) - 第二步
对C 代码进行综合
:
综合后会根据我们的功能函数,产生相应的电路。在 C 综合阶段,HLS 会根据我们对功能函数中的一些约束(Directive),来生成不同的接口。 - 第三步
C/RTL 的联合仿真
:
在这一阶段,HLS 会根据我们的 C Testbench 来生成我们的 RTL 的 Testbench 并且根据我们所选择的仿真工具来进行 RTL 级的仿真。仿真完成后我们可以观察联合仿真所产生的波形。 - 第四步
导出IP
:
前面有提到过 HLS 相当于一个 IP 生成器,它能够将我们的高级语言的代码映射为一个 IP,我们可以根据需要将这些 IP 导出到 Vivado 的集成开发环境中,将这些算法的 IP 应用到实际的工程当中。
1.2 HLS与VHDL/Verilog
- 随着FPGA密度随着工艺几何尺寸的缩小而不断增长,设计复杂性使得继续使用传统的HDL设计流程变得越来越困难。尽管HDL语言和工具已经发展,但是设计周期仍然长得令人讨厌。为了帮助解决该问题,出现了高级综合(HLS)编译器,以使设计人员能够进入更高的抽象级别。
- HLS能自动把 C/C++ 之类的高级语言转化成 Verilog/VHDL 之类的底层硬件描述语言(RTL),生成定制硬件在 FPGA 上跑实现加速。这使得不懂硬件的软件工程师也可以拥有玩转硬件的能力。
- 为了提高设计数字硬件组件的效率,高层综合(HLS)被视为提高设计抽象水平的下一步。但是,HLS工具的结果质量(QoR)往往落后于手动寄存器传输级别(RTL)流程的质量。
- HLS 经过十数年的发展,虽然有诸如 AutoPilot、OpenCL SDK 等 FPGA HLS 商业化成功的案例出现,但距离其完全替代人工 RTL 建模还有很长的路要走。
1.3 HLS优点与局限
(1)优点
- 第一,使对于软件工程,实现算法基于硬件(
ASIC
或者FPGA
)的计算加速。 - 第二,高层语言能促进
IP
重用的效率。 - 第三,HLS 能帮助软件和算法工程师参与、甚至主导芯片或 FPGA 设计。
- 第四、对于IC设计开发,从抽象的C层级进行功能设计。
- 第五、对于硬件验证,从更抽象的层次进行功能性验证,加速设计流程。
(2)局限
-
IP library
尚未全面还在不断升级,距离其完全替代人工RTL
建模还有路要走。 -
没有早期的性能估计以及任何违反设计和平台限制的行为
-
没有利用所有可能的数据通信方式
-
没有功能概述,也没有对用户代码进行优化转换
-
支持代码报告得太晚了
-
在某些情况下,工具的高效实施是不可能的,例如当必须将太多的加速器映射到硬件部分时。 HLS工具无法预先检测到这种情况,也无法在用户坚持的情况下尽量减轻其影响。
二、环境配置
安装 vivado
的参考链接:
https://blog.csdn.net/qq_43279579/article/details/116849636
对于vivado的安装,就已经自动完成了 HLS
在安装过程中会出现点击xsetup.exe
文件没有任何反应并且你以前是修改过cmd中中文显示的话,解决办法如下:
三、入门实验- LED闪烁仿真
3.1 创建项目
1、点击Vivado HLS 中的Create New Project
2、设置项目名
3.选择顶层函数,此处暂时不管
4、选择添加C仿真文件,此处可以暂时不管
5.选择器件
输入搜索选择芯片,点击ok
,点击finish
,完成工程创建。
3.2 添加文件
1.源文件添加
点击Source
,右键后,选择New File
,创建文件:
led.h
#ifndef _SHIFT_LED_H_
#define _SHIFT_LED_H_
#include "ap_int.h"
#define CNT_MAX 100000000
//#define CNT_MAX 100,100M时钟频率下计数一秒钟所需要的计数次数
#define FLASH_FLAG CNT_MAX-2
// typedef int led_t;
// typedef int cnt_t;
typedef ap_int<1> led_t;
typedef ap_int<32> cnt_t;
void flash_led(led_t *led_o , led_t led_i);
#endif
led.cpp
#include "led.h"
void flash_led(led_t *led_o , led_t led_i){
#pragma HLS INTERFACE ap_vld port=led_i
#pragma HLS INTERFACE ap_ovld port=led_o
cnt_t i;
for(i=0;i<CNT_MAX;i++){
if(i==FLASH_FLAG){
*led_o = ~led_i;
}
}
}
2.仿真测试文件添加
右键Test Bench
,选择New File
:
test_led.cpp
#include "led.h"
#include <stdio.h>
int main(){
led_t led_i=0x01;
led_t led_o;
const int SHIFT_TIME = 4;
int i;
for(i=0;i<SHIFT_TIME;i++){
flash_led(&led_o , led_i);
led_i = led_o;
printf("shift_out is %d \n",(int)(led_o&0x01));
}
}
3.3 C仿真与C综合
1.点击project
->project settings
->synthesis->browser
->选择顶层函数
2.点击project
->Run C Simulation
输出01交替,表示C仿真结果正确
3.点击Solution
->Run C Synthesis
->Active Solution
3.4 创建Vivado工程
1.打开Vivado
,选择Greate Project
2.点击Next
,进行项目信息填写
3.勾选RTL Project
4.Source
和 约束文件
添加,暂时不管,直接Next,之后选择器件
5.点击Finish
3.5 导入HLS生成的IP核
1.生成IP核
选择Solution
->Export RTL
在此处出现一个报错信息
:
解决方法如下:
参考Xilinx官网的补丁及使用方法进行修改
https://support.xilinx.com/s/article/76960?language=en_US
下载 Xilinx官网支持社区给出的补丁包,解压到Xilinx安装位置,如图所示:
打开cmd
,进入该目录,执行命令 python y2k22_patch\patch.py
:
2.导入
点击setting
选择IP
-> Repository
,并且点击加号
,选择solution
,将会自动识别到IP,识别到后,点击Apply
->OK
检验是否导入成功
生成IP
,选中后双击
3.6 添加实验代码
1.选择Add Sources
2.文件名称填写
代码内容:
`timescale 1ns / 1ps
module flash_led(
input wire clk ,
input wire rst_n ,
output wire led_o
);
wire rst ;//同步复位
wire ap_ready ;//当前可以接收下一次数据
reg ap_start ;//IP 开始工作
reg led_i_vld ;//输入数据有效
wire led_o_vld ;
reg led_i ;//输入的 led 信号
wire led_o_r ;
wire ap_done ;
wire ap_idle ;
reg [1:0] delay_cnt ;
assign rst = ~rst_n ;
assign led_o = led_o_r ;
//----------------delay_cnt------------------
always @(posedge clk) begin
if (rst==1'b1) begin
delay_cnt <= 'd0;
end
else if(delay_cnt[1]==1'b0) begin
delay_cnt <= delay_cnt + 1'b1;
end
end
//----------------ap_start------------------
always @(posedge clk) begin
if (rst==1'b1) begin
ap_start <= 1'b0;
end
else if(delay_cnt[1]==1'b1)begin
ap_start <= 1'b1;
end
end
//----------------led_i_vld------------------
always @(posedge clk) begin
if (rst==1'b1) begin
led_i_vld <= 1'b0;
end
else if(delay_cnt[1]==1'b1)begin
led_i_vld <= 1'b1;
end
end
//----------------ap_i------------------
always @(posedge clk) begin
if (rst==1'b1) begin
led_i <= 1'b0;
end
else if(led_o_vld==1'b1)begin
led_i <= led_o_r ;
end
end
flash_led_0 inst_flash_led (
.led_o_V_ap_vld(led_o_vld), // output wire led_o_V_ap_vld
.led_i_V_ap_vld(led_i_vld), // input wire led_i_V_ap_vld
.ap_clk(clk), // input wire ap_clk
.ap_rst(rst), // input wire ap_rst
.ap_start(ap_start), // input wire ap_start
.ap_done(ap_done), // output wire ap_done
.ap_idle(ap_idle), // output wire ap_idle
.ap_ready(ap_ready), // output wire ap_ready
.led_o_V(led_o_r), // output wire [0 : 0] led_o_V
.led_i_V(led_i) // input wire [0 : 0] led_i_V
);
endmodule
3.约束文件编写
创建约束文件
填写相关文件信息
`代码内容:
##############LED define##################
set_property PACKAGE_PIN P15 [get_ports {led_o}]
set_property IOSTANDARD LVCMOS33 [get_ports {led_o}]
##############Reset define##################
set_property PACKAGE_PIN P16 [get_ports {rst_n}]
set_property IOSTANDARD LVCMOS33 [get_ports {rst_n}]
##############50M CLK define##################
create_clock -period 20.000 -name clk -waveform {0.000 10.000} [get_ports clk]
set_property PACKAGE_PIN N18 [get_ports {clk}]
set_property IOSTANDARD LVCMOS33 [get_ports {clk}]
3.7 编译生成获取结果
1.生成
2.进行下载
点击Open Hardware Manager->Open target->Auto target
后,显示如下
3.8 说明
因为博主实验过程中没有板子,只能将整体的实验流程过一遍,无法上板验证了,但是过程和代码应该都是正确的。
总结
通过本次实验了解了HLS有关知识,学习了Soc芯片以及用C语言实现硬件对应的功能。在实验中遇到了一些问题,在查找资料后,基本解决。
参考文献
以后hls是否会替代Verilog成为主流FPGA编程语言?
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)