实验:FPGA计算3行同列数据之和
实验要求:PC机通过串口发送3行数据(一行有56个数据,3行共有56*3=168个数据)给FPGA,FPGA计算3行同一列数据的和,并将结果通过串口返回给上位机。
实现方法:使用两个FIFO IP Core,将串口接收到的数据进行缓存,当第一个FIFO1的数据存满后,将FIFO1的数据读出来给FIFO2,当FIFO2的数据存满时,当前两个FIFO的数据和串口正在接收的数据就可以看做为三行数据了。我们将3行数据同时读出,进行求和,然后用串口发送到上位机,这里要注意的是三个数据必须对齐,要不然是最终结果是不正确的。我这里为了验证方便,只生成了一行16个数据。
本设计是为了基于FPGA的Sobel边缘检测做基础,使用2/3个FIFO将图片数据缓存成3x3矩阵,不过偶然发现Xilinx也有shift_ram IP Core,这个IP简直是为生成3x3矩阵而生的,不过为了学习FIFO的使用,还是在这里用FIFO实现,我这里使用的是Xilinx的Vivado开发套件调用FIFO IP Core流程如下:
点击如图所示图标
按上图所示配置即可,这里的full信号是当FIFO写满后full会为1,否则为0,empty是当FIFO为空时FIFO为1,否则为0。
这里设置读写位宽和深度,添加复位信号,注意Xilinx的FIFO是高电平复位,设置复位类型为异步复位。剩下的按如图设置即可。其他均保持默认,点击OK。
点击generate生成IP Core。
生成好两个FIFO之后,按照系统流图,还需要添加串口接收和发送模块,这里我们可以把以前做过的串口代码直接拿过来用,代码都是可以移植的只需要稍微修改端口顶层例化即可。按照系统框图把顶层例化好之后,接下来就是仿真了,真是惭愧我到现在才学会了串口的仿真技巧,其实是自己悟到的,如下图,我这里的串口接收是以发送波特率的16倍进行接收的,在仿真时,波特率9600还是很慢,所以,我直接将接收波特率这里设置成50Mhz的两个时钟周期,那么发送也就是32个50Mhz的时钟周期,这里是50Mhz的原因是因为但是写串口接收发送这块的时候,使用的板子的系统时钟是50Mhz,这里移植的时候也要注意,最好使用PLL将系统时钟分频成50Mhz再给接收发送这两个模块。
//串口接收模块波特率查找表
always @(posedge mclk or negedge rst_n) begin
if(!rst_n)
bps_DR <= ;
else begin
case(baud_set)
: bps_DR <= ;//bps_9600x16
//0: bps_DR <= 1;//bps_9600x16 just test
: bps_DR <= ;//bps_19200x16
: bps_DR <= ;//bps_38400x16
: bps_DR <= ;//bps_57600x16
: bps_DR <= ;//bps_115200x16
default: bps_DR <= ;//bps_9600x16
endcase
end
end
//串口发送模块波特率查找表DR_LUT
always @(posedge mclk or negedge rst_n)begin
if(!rst_n)
bps_DR <= 'b0;
else begin
case(baud_set)
: bps_DR <= ;//bps_9600
//0: bps_DR <= 31;//bps_9600 just test
: bps_DR <= ;//bps_19200
: bps_DR <= ;//bps_38400
: bps_DR <= ;//bps_57600
: bps_DR <= ;//bps_115200
default: bps_DR <= ;//bps_9600
endcase
end
end
那么参数调整小了,仿真这块这么写呢?在test_bench文件中,我直接调用上面的工程顶层和串口发送模块,只需要将发送模块的数据给顶层模块,这样就方便了查看接收模块是否正确,
uart_fifo_tx uut_uart_fifo_tx(
.clk (clk),//125Mhz
.rst_n (rst_n),
.rs232_rx (rs232_rx),
.rs232_tx (rs232_tx)
); always # clk = ~clk; always # mclk = ~mclk; UART_Byte_Tx uut_UART_Byte_Tx(
.mclk (mclk),
.rst_n (rst_n),
.send_en (send_en),//时钟分频使能
.baud_set ('b0),//选择波特率
.data_byte (data_byte),//需要发送的信号
.uart_state (),//串口状态
.tx_done (),//标志串口结束信号
.rs232_tx (rs232_rx)//串口信号输出
);
然后是写激励,在工程代码中我们尽量少用for循环,但是在测试文件中便可以使用for循环来减少激励的书写量,提高仿真效率,这里的#7040是我在上面仿真的时候计算出来的,为什么是延时7040呢?这是因为上面串口发送模块波特率设置的是32个50Mhz时钟周期,那么它就是每隔7040ns会发送一次,同样的接收模块也是每隔7040ns接收一次,所以我这里每隔7040ns给一次数据,就可以实现仿真上连续发送了。
integer i; initial begin
clk = ;
mclk = ;
rst_n = ;
send_en = ;
data_byte = ;
#; rst_n = 'b1;
send_en = ;
for(i = ; i <= ; i = i + )begin
# data_byte = i;
end
end
测试文件写好之后,便是最令人抓狂的调试过程了,不过只要你掌握了仿真的调试技巧,所有问题都会迎刃而解的,我学习了FPGA一年了,才终于学会了仿真技巧能力,下面是我仿真这个实验的波形图,上面设置了很多不同颜色,增加了仿真效率,modelsim虽然好用,但是用vivado级联modelsim还是很慢的,所以还不如直接用vivado自带的仿真工具isim,只要掌握了使用isim的仿真技巧,再大的工程仿真起来也不怕!关于isim的使用技巧可以参考我的另一篇博客:Isim你不得不知道的技巧(整理)。这虽然是ISE那个版本的isim但是使用起来还是一样的!
这可能是我做过最漂亮的仿真了!
最后下载板子进行功能验证,发送3组00-0f的数据,最后由串口返回上位机的数据查看,三行数据一列求和的结果是完全正确的。至此实验结束,下面要进入基于FPGA的Sobel边缘检测实验了。
转载请注明出处:NingHeChuan(宁河川)
个人微信订阅号:开源FPGANingHeChuan
如果你想及时收到个人撰写的博文推送,可以扫描左边二维码(或者长按识别二维码)关注个人微信订阅号
知乎ID:NingHeChuan
微博ID:NingHeChuan