首页：修订间差异

2018年3月18日 (日) 04:32的版本

欢迎访问清华大学数字信号处理器课题组！

◇ 课题组简介
本课题组隶属于清华大学微电子所，主要从事高性能数字信号处理器系统设计研究。课题组目前包括孙义和教授，何虎副教授，杨旭副教授，郭德源，麻军平，李正兴。目前组内有博士研究生侯毓敏，硕士研究生尚瑛杰、赵烁。主要专注方向高性能数字信号处理器（DSP）设计计算存储一体计算机体系架构仿生生长型神经网络

◇ 科研成果展示
LilyARM处理器架构超标量(Superscalar)/超长指令字(VLIW)混合架构处理器LilyARM 采用超标量和超长指令字混合流水线设计技术（11级流水线）在六发射VLIW流水线基础上实现双发射超标量指令执行首次实现VLIW流水线分支预测功能兼容ARM v7a 指令集，1.9DMIPS/MHz，实测频率150MHz 实现了模拟电路隐蔽型硬件木马和抗硬件木马设计(R2D2: Runtime Reassurance and Detection of A2 Trojan Accepted by HOST2018) 集成了嵌入式1Mb的ReRAM
Evolution Neural Network 仿生型自生长神经网依靠计算能力实现的人工神经网不具备强（通用）人工智能的能力生物神经网既有精巧的信号处理网络，也有鲁棒性高，通用性好的学习网络生物网络天生具备因果学习机制，能够进行因果的学习和推理生物神经网络具备后天生长特性，可以增加神经网络原来不具备的功能生物神经网的记忆是分布式的，采用内容提取记忆的方式最新成果：Xu Yang, Guo Liu, Songgaojun Deng, Zichao Wei, Hu He*, Yingjie Shang, Ning Deng. Artif Intell Rev (2018). https://doi.org/10.1007/s10462-018-9626-2
Processing In Memory Processing In Memory PIM 清华大学微电子所与三星半导体成立了联合实验室；计算存储一体架构研究就是该联合实验室研究课题之一；项目目标是在传统DDR存储器中三维集成一个专用数据处理器；通过分布式计算将部分数据处理任务从CPU分配到DDR存储器；这样既可以简化主控CPU的设计复杂度，降低功耗，又可以提高存储器访问效率；最终实现存储器计算架构；完成了基于gem5模拟的架构设计任务，提出了PIM编程范式，模拟器模拟结果符合预期；完成了FPGA仿真过程，实现了主控CPU+LINUX以及PIM处理器原型验证。目前正在完善软件编程模型。
Lily处理器架构可配置超长指令字处理器 Lily 在2006年信息产业部集成电路发展资金的资助下，清华大学数字信号处理器实验室开始了商业化DSP的研究，开发代号LILY；体系结构相关论文“Architecture Design of A Variable Length Instruction Set VLIW DSP”刊发于清华学报英文版；申请了两项体系结构专利（200810006836.7，200810101451.9）；该处理器拥有最高8路功能单元的VLIW内核设计，拥有两级缓存；完善的软件工具链，包括：基于Open64的C编译器，基于Binutils的二进制工具链，RTL级指令精度仿真器ISS，基于gem5的软件模拟器；在LILY的基础上，研制出VLIW/RISC融合型通用处理器LILY2。该处理器吸收了VLIW显示并行，低功耗的优点，又同时具备通用RISC处理器编程友好的特点； LILY2目前完成了RTL和GCC编译器，gem5模拟器等设计工作。基于通用处理器指令集的LILY2架构处理器已经完成RTL设计，通用性能和DSP性能均优于同类处理器。基于Lily架构的高性能密码处理器已经应用在中星微高清视频监控系统芯片中。目前已经流片量产。
Magnolia处理器架构 VLIW架构通用处理器 Magnolia 2009年设计完成的一款面向通用应用的的超长指令字处理器，开发代号Magnolia；该处理器利用VLIW架构提高指令并行度，并且设计了定点和浮点向量单元，提高数据并行度； 32位指令宽度下，拥有近900条定点，浮点和向量指令；申请多项体系结构专利，并发表多篇论文；基于Open64的高性能C编译器，研究并提供编译器自动向量化支持；基于Gem5的模拟器支持程序级和操作系统级的周期精度模拟；基于Binutils的GNU标准二进制工具；里程碑(2011.12.28)：Magnolia DSP 的完整软件工具链开发完成，包括Gem5(仿真器)、Binutils(汇编器/链接器等二进制工具)、Open64(C编译器)、Newlib(C函数库)、GDB(调试器)，并且实现了通过共享内存通信的多核仿真。通过gcc.c-torture、Dhrystone等大量测试，整个软件工具链构成有机整体，处于较成熟稳定的状态。
更多科研成果...

◇ 专利列表
授权专利一种超长指令字处理的方法和装置一种超长指令字指令并行执行方法及装置完成两次乘法两次加法两次位移的微处理器实现方法微处理器（CN201010033646.1）一种多周期指令执行方法和装置支持同时多线程的超长指令字处理器结构一种交替访问寄存器的装置及其方法融合了顺序和VLIW的处理器体系结构及指令执行方法一种支持超标量与超长指令字混合架构处理器的分支预测方法一种以现场可编程门阵列的逻辑片为基本单元模拟生物神经元网络的方法一种基于进化算法的自适应学习神经网络实现方法　受理专利一种计算存储一体的分布式计算机架构一种基于现场可编程门阵列实现神经网络计算的方法一种自生成神经网络构建方法

快速导航
成员个人主页何虎　 - Hu He 杨旭　 - Xu Yang 郭德源 - Deyuan Guo 黎峥　 - Zheng Li 刘源　 - Yuan Liu 指令集文档下载 Lily指令集 Magnolia指令集 Lily2指令集密码处理器IP 密码处理器IP(CDSP)简介开源软件工具链开发 DSPDEV Website

友情链接
清华大学微电子所清华大学计算机系高性能所 Open64 Compiler Gem5 Simulator 中星微电子有限公司

@@ 第17行： / 第17行： @@
 本课题组隶属于清华大学微电子所，主要从事高性能数字信号处理器系统设计研究。
-课题组目前包括孙义和教授，[[何虎]]副教授，[[杨旭]]博士，[[郭德源]]，麻军平，李正兴。 目前组内有博士研究生1名，硕士研究生7名。
+课题组目前包括孙义和教授，[[何虎]]副教授，[[杨旭]]副教授，[[郭德源]]，麻军平，李正兴。 目前组内有博士研究生侯毓敏，硕士研究生尚瑛杰、赵烁。
 * '''主要专注方向'''
 ** 高性能数字信号处理器（DSP）设计
-** 处理器指令精度模拟器研究
+** 计算存储一体计算机体系架构
-** 并行程序设计模型与编译技术
+** 仿生生长型神经网络
-** 适应视频图像处理和科学计算的计算机体系结构
-** 多核、众核片上系统
-** 片上网络（NoC）设计
-** 神经网络，类脑计算
 |-
@@ 第37行： / 第33行： @@
 |-
 |
-* '''进化神经网'''
+[[File:LilyARM_pipeline.jpg|400px|thumb|LilyARM处理器架构]]
+* '''超标量(Superscalar)/超长指令字(VLIW)混合架构处理器'''[[File:thu-dsp-logo-60x44.bmp|20px]]''LilyARM''
+** 采用超标量和超长指令字混合流水线设计技术（11级流水线）
+** 在六发射VLIW流水线基础上实现双发射超标量指令执行
+** 首次实现VLIW流水线分支预测功能
+** 兼容ARM v7a 指令集，1.9DMIPS/MHz，实测频率150MHz
+** 实现了模拟电路隐蔽型硬件木马和抗硬件木马设计(R2D2: Runtime Reassurance and Detection of A2 Trojan Accepted by HOST2018)
+** 集成了嵌入式1Mb的ReRAM
+&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[[File:Merlin.jpg|240px|Merlin Die]]&nbsp;[[File:Merlin_chip.jpg|180px|Merlin Chip]]
+|-
+|
 [[File:enn.png|150px|thumb|Evolution Neural Network]]
-** 依靠计算能力实现的人工神经网不具备强人工智能的能力
+* '''仿生型自生长神经网'''
-** 与其破解生物神经网实现智能的奥秘，不如从头实现神经网进化过程
+** 依靠计算能力实现的人工神经网不具备强（通用）人工智能的能力
-** 进化神经网通过构建神经网进化环境，采用优胜劣汰的进化法则实现神经网的进化
+** 生物神经网既有精巧的信号处理网络，也有鲁棒性高，通用性好的学习网络
-** 进化过程带有很强的随机性，进化出来的神经网将具备强智能
+** 生物网络天生具备因果学习机制，能够进行因果的学习和推理
+** 生物神经网络具备后天生长特性，可以增加神经网络原来不具备的功能
+** 生物神经网的记忆是分布式的，采用内容提取记忆的方式
+** 最新成果：Xu Yang, Guo Liu, Songgaojun Deng, Zichao Wei, Hu He*, Yingjie Shang, Ning Deng. Artif Intell Rev (2018). https://doi.org/10.1007/s10462-018-9626-2
 |-
 |
@@ 第49行： / 第57行： @@
 * '''Processing In Memory''' [[File:thu-dsp-logo-60x44.bmp|20px]]''PIM''
 ** 清华大学微电子所与三星半导体成立了联合实验室；
-** 存储器计算架构研究就是该联合实验室研究课题之一；
+** 计算存储一体架构研究就是该联合实验室研究课题之一；
 ** 项目目标是在传统DDR存储器中三维集成一个专用数据处理器；
 ** 通过分布式计算将部分数据处理任务从CPU分配到DDR存储器；
 ** 这样既可以简化主控CPU的设计复杂度，降低功耗，又可以提高存储器访问效率；
 ** 最终实现存储器计算架构；
-** 目前该项目已经完成了基于gem5模拟的架构设计任务，提出了PIM编程范式，模拟器模拟结果符合预期。
+** 完成了基于gem5模拟的架构设计任务，提出了PIM编程范式，模拟器模拟结果符合预期；
+** 完成了FPGA仿真过程，实现了主控CPU+LINUX以及PIM处理器原型验证。
+** 目前正在完善软件编程模型。
 |-
 |
@@ 第66行： / 第76行： @@
 ** 在LILY的基础上，研制出VLIW/RISC融合型通用处理器LILY2。该处理器吸收了VLIW显示并行，低功耗的优点，又同时具备通用RISC处理器编程友好的特点；
 ** LILY2目前完成了RTL和GCC编译器，gem5模拟器等设计工作。
+** 基于通用处理器指令集的LILY2架构处理器已经完成RTL设计，通用性能和DSP性能均优于同类处理器。
 ** 基于Lily架构的高性能密码处理器已经应用在中星微高清视频监控系统芯片中。目前已经流片量产。
-&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[[File:Svac_chip.jpg|150px]] [[File:Svac_layout.jpg|210px]]
+&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[[File:Svac_chip.jpg|150px|SVAC SoC Chip]] [[File:Svac_layout.jpg|210px|SVAC SoC Die]]
 |-
 |
@@ 第100行： / 第111行： @@
 # 一种交替访问寄存器的装置及其方法
 # 融合了顺序和VLIW的处理器体系结构及指令执行方法
-受理专利
-# 扩展处理器寄存器堆容量的方法
 # 一种支持超标量与超长指令字混合架构处理器的分支预测方法
-# 一种基于现场可编程门阵列实现神经网络计算的方法
 # 一种以现场可编程门阵列的逻辑片为基本单元模拟生物神经元网络的方法
 # 一种基于进化算法的自适应学习神经网络实现方法
+受理专利
+# 一种计算存储一体的分布式计算机架构
+# 一种基于现场可编程门阵列实现神经网络计算的方法
 # 一种自生成神经网络构建方法

首页：修订间差异

2018年3月18日 (日) 04:32的版本

◇ 课题组简介

◇ 科研成果展示

◇ 专利列表

导航菜单

页面操作

页面操作

个人工具

导航

搜索

工具