首页:修订间差异

来自清华大学高性能处理器实验室
跳到导航跳到搜索
(未显示同一用户的33个中间版本)
第17行: 第17行:
本课题组隶属于清华大学微电子所,主要从事高性能数字信号处理器系统设计研究。
本课题组隶属于清华大学微电子所,主要从事高性能数字信号处理器系统设计研究。


课题组目前包括[[何虎]]副教授,李翔宇副教授,[[杨旭]]博士,[[郭德源]],[http://dsp.ime.tsinghua.edu.cn/lizheng 黎峥]博士,麻军平,杜勇。 目前组内有博士研究生1名,硕士研究生12名。
课题组目前包括孙义和教授,[[何虎]]副教授,[[杨旭]]副教授,[[郭德源]],麻军平,李正兴。 目前组内有博士研究生1名,硕士研究生7名。


* '''主要专注方向'''
* '''主要专注方向'''
第23行: 第23行:
** 处理器指令精度模拟器研究
** 处理器指令精度模拟器研究
** 并行程序设计模型与编译技术
** 并行程序设计模型与编译技术
** 适应视频图像处理和科学计算的计算机体系结构
** 多核、众核片上系统
** 多核、众核片上系统
** 片上网络(NoC)设计
** 片上网络(NoC)设计
** 超大规模集成电路(VLSI)测试方法学和可测性设计
** 神经网络,类脑计算
** 集成电路和处理器新技术和新方向
 
* '''主要资助来源'''
** 国家自然科学基金
** 工信部集成电路发展资金
** 核高基重大专项
** 教育部博士点基金
** 清华大学校基金
** 其他合作项目


|-
|-
第44行: 第34行:


=== ◇ 科研成果展示 ===
=== ◇ 科研成果展示 ===
|-
|
[[File:enn.png|150px|thumb|Evolution Neural Network]]
* '''进化神经网'''
** 依靠计算能力实现的人工神经网不具备强(通用)人工智能的能力
** 与其破解生物神经网实现智能的奥秘,不如从头实现神经网进化过程
** 进化神经网通过构建神经网进化环境,采用优胜劣汰的进化法则实现神经网的进化
** 进化过程带有很强的随机性,进化出来的神经网不确定性高,期望通过这种方式发现具备强智能的人工神经网
** 由于进化过程指引万千,进化过程计算量过于巨大,目前采用果蝇复眼神经网为进化对象
|-
|
[[File:Pim.jpg|200px|thumb|Processing In Memory]]
* '''Processing In Memory''' [[File:thu-dsp-logo-60x44.bmp|20px]]''PIM''
** 清华大学微电子所与三星半导体成立了联合实验室;
** 计算存储一体架构研究就是该联合实验室研究课题之一;
** 项目目标是在传统DDR存储器中三维集成一个专用数据处理器;
** 通过分布式计算将部分数据处理任务从CPU分配到DDR存储器;
** 这样既可以简化主控CPU的设计复杂度,降低功耗,又可以提高存储器访问效率;
** 最终实现存储器计算架构;
** 目前该项目已经完成了基于gem5模拟的架构设计任务,提出了PIM编程范式,模拟器模拟结果符合预期;
** 目前该项目进入FPGA实现阶段。
|-
|-
|
|
[[File:Lily.jpg|thumb|Lily处理器架构]]
[[File:Lily.jpg|thumb|Lily处理器架构]]
* '''可配置超长指令字处理器''' [[File:thu-dsp-logo-60x44.bmp|20px]]''Lily''
* '''可配置超长指令字处理器''' [[File:thu-dsp-logo-60x44.bmp|20px]]''Lily''
** 在2006年信息产业部集成电路发展资金的资助下,清华大学数字信号处理器实验室开始了商品化DSP的研究,开发代号LILY;
** 在2006年信息产业部集成电路发展资金的资助下,清华大学数字信号处理器实验室开始了商业化DSP的研究,开发代号LILY;
** 体系结构相关论文“Architecture Design of A Variable Length Instruction Set VLIW DSP”刊发于清华学报英文版;
** 体系结构相关论文“Architecture Design of A Variable Length Instruction Set VLIW DSP”刊发于清华学报英文版;
** 申请了两项体系结构专利(200810006836.7,200810101451.9);
** 申请了两项体系结构专利(200810006836.7,200810101451.9);
第55行: 第67行:
** 在LILY的基础上,研制出VLIW/RISC融合型通用处理器LILY2。该处理器吸收了VLIW显示并行,低功耗的优点,又同时具备通用RISC处理器编程友好的特点;
** 在LILY的基础上,研制出VLIW/RISC融合型通用处理器LILY2。该处理器吸收了VLIW显示并行,低功耗的优点,又同时具备通用RISC处理器编程友好的特点;
** LILY2目前完成了RTL和GCC编译器,gem5模拟器等设计工作。
** LILY2目前完成了RTL和GCC编译器,gem5模拟器等设计工作。
** 基于通用处理器指令集的LILY2架构处理器已经完成RTL设计,通用性能和DSP性能均优于同类处理器。
** 基于Lily架构的高性能密码处理器已经应用在中星微高清视频监控系统芯片中。目前已经流片量产。
** 基于Lily架构的高性能密码处理器已经应用在中星微高清视频监控系统芯片中。目前已经流片量产。
     [[File:Svac_chip.jpg|150px]] [[File:Svac_layout.jpg|210px]]
      [[File:Svac_chip.jpg|150px]] [[File:Svac_layout.jpg|210px]]
|-
|-
|
|
第80行: 第93行:
|-
|-
|  
|  
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN200810006836.7&leixin=fmzl&title=一种超长指令字处理的方法和装置&ipc=G06F9/38(2006.01)I 一种超长指令字处理的方法和装置]
授权专利
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN200810101451.9&leixin=fmzl&title=一种超长指令字指令并行执行方法及装置&ipc=G06F9/38(2006.01)I 一种超长指令字指令并行执行方法及装置]
# 一种超长指令字处理的方法和装置
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN200910090204.8&leixin=fmzl&title=完成两次乘法两次加法两次位移的微处理器实现方法&ipc=G06F9/38(2006.01)I 一种保存子函数调用指令返回地址的微处理器实现方法]
# 一种超长指令字指令并行执行方法及装置
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN201010033646.1&leixin=fmzl&title=微处理器&ipc=G06F9/30(2006.01)I 微处理器]
# 完成两次乘法两次加法两次位移的微处理器实现方法
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN201010207978.7&leixin=fmzl&title=一种多周期指令执行方法和装置&ipc=G06F9/38(2006.01)I 一种多周期指令执行方法和装置]
# 微处理器(CN201010033646.1)
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN201010547535.2&leixin=fmzl&title=支持同时多线程的超长指令字处理器结构&ipc=G06F15/80(2006.01)I 支持同时多线程的超长指令字处理器结构]
# 一种多周期指令执行方法和装置
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN201110155004.3&leixin=fmzl&title=一种交替访问寄存器的装置及其方法&ipc=G06F9/30(2006.01)I 一种交替访问寄存器的装置及其方法]
# 支持同时多线程的超长指令字处理器结构
# [http://211.157.104.87:8080/sipo/zljs/hyjs-yx-new.jsp?recid=CN201210279663.2&leixin=fmzl&title=%C8%DA%BA%CF%C1%CB%CB%B3%D0%F2%BA%CDVLIW%B5%C4%B4%A6%C0%ED%C6%F7%CC%E5%CF%B5%BD%E1%B9%B9%BC%B0%D6%B8%C1%EE%D6%B4%D0%D0%B7%BD%B7%A8&ipc=G06F9/38(2006.01)I 融合了顺序和VLIW的处理器体系结构及指令执行方法]
# 一种交替访问寄存器的装置及其方法
# 融合了顺序和VLIW的处理器体系结构及指令执行方法
# 一种支持超标量与超长指令字混合架构处理器的分支预测方法
受理专利
# 一种计算存储一体的分布式计算机架构
# 扩展处理器寄存器堆容量的方法
# 一种基于现场可编程门阵列实现神经网络计算的方法
# 一种以现场可编程门阵列的逻辑片为基本单元模拟生物神经元网络的方法
# 一种基于进化算法的自适应学习神经网络实现方法 
# 一种自生成神经网络构建方法 
 
|-
|-
|}
|}
第111行: 第134行:


* 密码处理器IP
* 密码处理器IP
: [[media:Overview_of_THU_CDSP.pdf | 密码处理器IP(CDSP)简介]]
: [[media:密码处理器介绍.pdf | 密码处理器IP(CDSP)简介]]


* 开源软件工具链开发
* 开源软件工具链开发
第138行: 第161行:


<font size="1">
<font size="1">
Copyright &copy; 2009-2014 DSP Laboratory, Institute of Microelectronics, Tsinghua University. All Rights Reserved. 清华大学微电子所数字信号处理器实验室 版权所有.
Copyright &copy; 2009-2016 DSP Laboratory, Institute of Microelectronics, Tsinghua University. All Rights Reserved. 清华大学微电子所数字信号处理器实验室 版权所有.
</font>
</font>

2017年5月7日 (日) 00:31的版本

欢迎访问 清华大学数字信号处理器课题组!

◇ 课题组简介

本课题组隶属于清华大学微电子所,主要从事高性能数字信号处理器系统设计研究。

课题组目前包括孙义和教授,何虎副教授,杨旭副教授,郭德源,麻军平,李正兴。 目前组内有博士研究生1名,硕士研究生7名。

  • 主要专注方向
    • 高性能数字信号处理器(DSP)设计
    • 处理器指令精度模拟器研究
    • 并行程序设计模型与编译技术
    • 多核、众核片上系统
    • 片上网络(NoC)设计
    • 神经网络,类脑计算

◇ 科研成果展示

Evolution Neural Network
  • 进化神经网
    • 依靠计算能力实现的人工神经网不具备强(通用)人工智能的能力
    • 与其破解生物神经网实现智能的奥秘,不如从头实现神经网进化过程
    • 进化神经网通过构建神经网进化环境,采用优胜劣汰的进化法则实现神经网的进化
    • 进化过程带有很强的随机性,进化出来的神经网不确定性高,期望通过这种方式发现具备强智能的人工神经网
    • 由于进化过程指引万千,进化过程计算量过于巨大,目前采用果蝇复眼神经网为进化对象
Processing In Memory
  • Processing In Memory Thu-dsp-logo-60x44.bmpPIM
    • 清华大学微电子所与三星半导体成立了联合实验室;
    • 计算存储一体架构研究就是该联合实验室研究课题之一;
    • 项目目标是在传统DDR存储器中三维集成一个专用数据处理器;
    • 通过分布式计算将部分数据处理任务从CPU分配到DDR存储器;
    • 这样既可以简化主控CPU的设计复杂度,降低功耗,又可以提高存储器访问效率;
    • 最终实现存储器计算架构;
    • 目前该项目已经完成了基于gem5模拟的架构设计任务,提出了PIM编程范式,模拟器模拟结果符合预期;
    • 目前该项目进入FPGA实现阶段。
Lily处理器架构
  • 可配置超长指令字处理器 Thu-dsp-logo-60x44.bmpLily
    • 在2006年信息产业部集成电路发展资金的资助下,清华大学数字信号处理器实验室开始了商业化DSP的研究,开发代号LILY;
    • 体系结构相关论文“Architecture Design of A Variable Length Instruction Set VLIW DSP”刊发于清华学报英文版;
    • 申请了两项体系结构专利(200810006836.7,200810101451.9);
    • 该处理器拥有最高8路功能单元的VLIW内核设计,拥有两级缓存;
    • 完善的软件工具链,包括:基于Open64的C编译器,基于Binutils的二进制工具链,RTL级指令精度仿真器ISS,基于gem5的软件模拟器;
    • 在LILY的基础上,研制出VLIW/RISC融合型通用处理器LILY2。该处理器吸收了VLIW显示并行,低功耗的优点,又同时具备通用RISC处理器编程友好的特点;
    • LILY2目前完成了RTL和GCC编译器,gem5模拟器等设计工作。
    • 基于通用处理器指令集的LILY2架构处理器已经完成RTL设计,通用性能和DSP性能均优于同类处理器。
    • 基于Lily架构的高性能密码处理器已经应用在中星微高清视频监控系统芯片中。目前已经流片量产。

      Svac chip.jpg Svac layout.jpg

Magnolia处理器架构
  • VLIW架构通用处理器 Thu-dsp-logo-60x44.bmpMagnolia
    • 2009年设计完成的一款面向通用应用的的超长指令字处理器,开发代号Magnolia;
    • 该处理器利用VLIW架构提高指令并行度,并且设计了定点和浮点向量单元,提高数据并行度;
    • 32位指令宽度下,拥有近900条定点,浮点和向量指令;
    • 申请多项体系结构专利,并发表多篇论文;
    • 基于Open64的高性能C编译器,研究并提供编译器自动向量化支持;
    • 基于Gem5的模拟器支持程序级和操作系统级的周期精度模拟;
    • 基于Binutils的GNU标准二进制工具;
    • 里程碑(2011.12.28):Magnolia DSP 的完整软件工具链开发完成,包括Gem5(仿真器)、Binutils(汇编器/链接器等二进制工具)、Open64(C编译器)、Newlib(C函数库)、GDB(调试器),并且实现了通过共享内存通信的多核仿真。通过gcc.c-torture、Dhrystone等大量测试,整个软件工具链构成有机整体,处于较成熟稳定的状态。
更多科研成果...

◇ 专利列表

授权专利

  1. 一种超长指令字处理的方法和装置
  2. 一种超长指令字指令并行执行方法及装置
  3. 完成两次乘法两次加法两次位移的微处理器实现方法
  4. 微处理器(CN201010033646.1)
  5. 一种多周期指令执行方法和装置
  6. 支持同时多线程的超长指令字处理器结构
  7. 一种交替访问寄存器的装置及其方法
  8. 融合了顺序和VLIW的处理器体系结构及指令执行方法
  9. 一种支持超标量与超长指令字混合架构处理器的分支预测方法

受理专利

  1. 一种计算存储一体的分布式计算机架构
  2. 扩展处理器寄存器堆容量的方法
  3. 一种基于现场可编程门阵列实现神经网络计算的方法
  4. 一种以现场可编程门阵列的逻辑片为基本单元模拟生物神经元网络的方法
  5. 一种基于进化算法的自适应学习神经网络实现方法 
  6. 一种自生成神经网络构建方法 
快速导航
  • 成员个人主页
何虎  - Hu He
杨旭  - Xu Yang
郭德源 - Deyuan Guo
黎峥  - Zheng Li
刘源  - Yuan Liu
  • 指令集文档下载
Lily指令集
Magnolia指令集
Lily2指令集
  • 密码处理器IP
密码处理器IP(CDSP)简介
  • 开源软件工具链开发
DSPDEV Website
友情链接



Copyright © 2009-2016 DSP Laboratory, Institute of Microelectronics, Tsinghua University. All Rights Reserved. 清华大学微电子所数字信号处理器实验室 版权所有.