Table of contents 序 引言 FPGA硬件概述 查找表 BRAM和DSP FPGA计算系统 HLS的编程模型 接口和数据类型 流水线并行 数据并行 模块间并行 并行函数设计 向量加法 向量累加 前缀扫描 直方图统计 图像处理方法 图像处理算法 滤波器 矩阵乘法 分块矩阵乘法 二维脉动阵列 Google TPU设计分析 Telsa FSD设计分析 矩阵乘法的设计框架 附录A: 浮点数的计算正确性 附录B:中英文对照和缩略词 附录C:分块矩阵乘法代码详解