FPGA计算3行同列数据之和

实验：FPGA计算3行同列数据之和

实验要求：PC机通过串口发送3行数据（一行有56个数据，3行共有56*3=168个数据）给FPGA，FPGA计算3行同一列数据的和，并将结果通过串口返回给上位机。

实现方法：使用两个FIFO IP Core，将串口接收到的数据进行缓存，当第一个FIFO1的数据存满后，将FIFO1的数据读出来给FIFO2，当FIFO2的数据存满时，当前两个FIFO的数据和串口正在接收的数据就可以看做为三行数据了。我们将3行数据同时读出，进行求和，然后用串口发送到上位机，这里要注意的是三个数据必须对齐，要不然是最终结果是不正确的。我这里为了验证方便，只生成了一行16个数据。

FPGA计算3行同列数据之和

　　本设计是为了基于FPGA的Sobel边缘检测做基础，使用2/3个FIFO将图片数据缓存成3x3矩阵，不过偶然发现Xilinx也有shift_ram IP Core，这个IP简直是为生成3x3矩阵而生的，不过为了学习FIFO的使用，还是在这里用FIFO实现，我这里使用的是Xilinx的Vivado开发套件调用FIFO IP Core流程如下： FPGA计算3行同列数据之和

点击如图所示图标

FPGA计算3行同列数据之和

按上图所示配置即可，这里的full信号是当FIFO写满后full会为1，否则为0，empty是当FIFO为空时FIFO为1，否则为0。 FPGA计算3行同列数据之和

这里设置读写位宽和深度，添加复位信号，注意Xilinx的FIFO是高电平复位，设置复位类型为异步复位。剩下的按如图设置即可。其他均保持默认，点击OK。

FPGA计算3行同列数据之和

点击generate生成IP Core。

生成好两个FIFO之后，按照系统流图，还需要添加串口接收和发送模块，这里我们可以把以前做过的串口代码直接拿过来用，代码都是可以移植的只需要稍微修改端口顶层例化即可。按照系统框图把顶层例化好之后，接下来就是仿真了，真是惭愧我到现在才学会了串口的仿真技巧，其实是自己悟到的，如下图，我这里的串口接收是以发送波特率的16倍进行接收的，在仿真时，波特率9600还是很慢，所以，我直接将接收波特率这里设置成50Mhz的两个时钟周期，那么发送也就是32个50Mhz的时钟周期，这里是50Mhz的原因是因为但是写串口接收发送这块的时候，使用的板子的系统时钟是50Mhz，这里移植的时候也要注意，最好使用PLL将系统时钟分频成50Mhz再给接收发送这两个模块。

 //串口接收模块波特率查找表

 always @(posedge mclk or negedge rst_n) begin

     if(!rst_n)

         bps_DR <= ;

     else begin

         case(baud_set)

         : bps_DR <= ;//bps_9600x16

         //0: bps_DR <= 1;//bps_9600x16 just test

         : bps_DR <= ;//bps_19200x16

         : bps_DR <= ;//bps_38400x16

         : bps_DR <= ;//bps_57600x16

         : bps_DR <= ;//bps_115200x16

         default: bps_DR <= ;//bps_9600x16

         endcase

     end

 end

 //串口发送模块波特率查找表DR_LUT

 always @(posedge mclk or negedge rst_n)begin

     if(!rst_n)

         bps_DR <= 'b0;

     else begin

         case(baud_set)

         : bps_DR <= ;//bps_9600

         //0: bps_DR <= 31;//bps_9600 just test

         : bps_DR <= ;//bps_19200

         : bps_DR <= ;//bps_38400

         : bps_DR <= ;//bps_57600

         : bps_DR <= ;//bps_115200

         default: bps_DR <= ;//bps_9600

         endcase

     end

 end

　　那么参数调整小了，仿真这块这么写呢？在test_bench文件中，我直接调用上面的工程顶层和串口发送模块，只需要将发送模块的数据给顶层模块，这样就方便了查看接收模块是否正确，

 uart_fifo_tx uut_uart_fifo_tx(

     .clk                (clk),//125Mhz

     .rst_n                (rst_n),

     .rs232_rx            (rs232_rx),

     .rs232_tx            (rs232_tx)

     );    

 always # clk = ~clk;

 always # mclk = ~mclk;

 UART_Byte_Tx uut_UART_Byte_Tx(

     .mclk                (mclk),

     .rst_n                (rst_n),

     .send_en            (send_en),//时钟分频使能

     .baud_set            ('b0),//选择波特率

     .data_byte            (data_byte),//需要发送的信号

     .uart_state            (),//串口状态

     .tx_done            (),//标志串口结束信号

     .rs232_tx            (rs232_rx)//串口信号输出

  );

　　然后是写激励，在工程代码中我们尽量少用for循环，但是在测试文件中便可以使用for循环来减少激励的书写量，提高仿真效率，这里的#7040是我在上面仿真的时候计算出来的，为什么是延时7040呢？这是因为上面串口发送模块波特率设置的是32个50Mhz时钟周期，那么它就是每隔7040ns会发送一次，同样的接收模块也是每隔7040ns接收一次，所以我这里每隔7040ns给一次数据，就可以实现仿真上连续发送了。

 integer i;

 initial begin

     clk = ;

     mclk = ;

     rst_n = ;

     send_en = ;

     data_byte = ;

 #; rst_n = 'b1;

     send_en = ;

     for(i = ; i <= ; i = i + )begin

         # data_byte = i;

     end

 end

　　测试文件写好之后，便是最令人抓狂的调试过程了，不过只要你掌握了仿真的调试技巧，所有问题都会迎刃而解的，我学习了FPGA一年了，才终于学会了仿真技巧能力，下面是我仿真这个实验的波形图，上面设置了很多不同颜色，增加了仿真效率，modelsim虽然好用，但是用vivado级联modelsim还是很慢的，所以还不如直接用vivado自带的仿真工具isim，只要掌握了使用isim的仿真技巧，再大的工程仿真起来也不怕！关于isim的使用技巧可以参考我的另一篇博客：Isim你不得不知道的技巧（整理）。这虽然是ISE那个版本的isim但是使用起来还是一样的！

FPGA计算3行同列数据之和