您当前的位置:首页 > 论文浏览
您选择的条件: 陈明宇(7)

1. chinaXiv:201703.00223 [pdf]

一种新型高效的算法级容错技术及实现

王睿; 姚二林; 陈明宇; 谭光明
分类: 计算机科学 >> 计算机科学的集成理论

随着高性能计算系统规模的不断扩大,节点失效愈加频发。传统的容错技术大都基于检查点 (checkpoint)方式。但是,检查点技术的开销随着系统规模的扩大而不断增加,在百亿亿次(Exaflops) 规模下其容错效率难以满足系统需求。算法失效恢复技术相比检查点方式具有更高的效率。然而,该技术依然基于停等模式。对于大规模系统,停等模式在很大程度上会影响程序的并行效率。本文提出了一种非 停等的算法级容错策略——热替换策略。在程序运行过程中若发生节点失效,不用停等恢复失效节点上的 数据,而用冗余节点替换失效节点,使计算能继续进行。终的正确结果可以通过一个线性变换求出。为 了论证方案的有效性,我们结合 MPICH 的容错特性实现了容错的 High Performance Linpack (HPL),并评估 了方案的性能。实验结果表明,即使在小规模下,我们的方案的性能也明显优于算法失效恢复技术。

提交时间: 2017-03-10 点击量2872下载量671 评论 0

2. chinaXiv:201703.00203 [pdf]

大规模众核体系结构的并行模拟

叶笑春; 范东睿; 陈明宇; 吕慧伟
分类: 计算机科学 >> 计算机体系结构

随着芯片内部处理器核数的增多,多核处理器逐渐有向众核方向发展的趋势。而众核这一全新的体系结构给计算机模拟带来了挑战。串行模拟已经难以满足速度的需求,必须充分利用现有并行宿主机的多核资源,在保证不损失模拟精度的前提下提升模拟速度。本文以众核和众核集群两种体系结构为例,说明并行模拟技术在计算机并行体系结构模拟中的必要性和可行性,在众核模拟中,做到精度不变,模拟速度 提升 10 倍;在众核集群模拟中,所模拟的处理器小核总数达到千核规模,并实现了混合的编程运行环境, 为该结构的可扩展性测试提供了基础。

提交时间: 2017-03-10 点击量842下载量639 评论 0

3. chinaXiv:201611.00855 [pdf]

选择最优存储格式实现稀疏矩阵乘法的研究

李佳佳; 张秀霞; 谭光明; 陈明宇
分类: 计算机科学 >> 计算机应用技术

稀疏矩阵向量乘法是科学和工程领域中重要的核心子程序之一,也是稀疏BLAS(Basic Linear AlgebraSubprograms,基本线性代数子程序)库的重要组成。本文提出一个稀疏矩阵向量乘法的自动调优器SMAT。对于一个给定的稀疏矩阵,SMAT 可以选择并返回最优的存储格式。我们使用佛罗里达大学的2316 个稀疏矩阵作为测试集,SMAT 获得性能达到所选格式最好性能96%以上。SMAT 在Intel X5680 平台上的预测准确率为89.34% (单精度)和 86.18%(双精度),在AMD Opteron 6168 平台上准确率达到了85.10%(单精度)和82.09%(双精度)。同时,SMAT 的在线搜索时间在需要调用上百次稀疏矩阵向量乘法的应用中是可以接受的。

提交时间: 2016-11-15 点击量7225下载量2677 评论 0

4. chinaXiv:201606.00053 [pdf]

一种新型高效的算法级容错技术及实现

王睿; 姚二林; 陈明宇; 谭光明
分类: 计算机科学 >> 计算机软件

随着高性能计算系统规模的不断扩大,节点失效愈加频发。传统的容错技术大都基于检查点(checkpoint)方式。但是,检查点技术的开销随着系统规模的扩大而不断增加,在百亿亿次(Exaflops)规模下其容错效率难以满足系统需求。算法失效恢复技术相比检查点方式具有更高的效率。然而,该技术依然基于停等模式。对于大规模系统,停等模式在很大程度上会影响程序的并行效率。本文提出了一种非停等的算法级容错策略——热替换策略。在程序运行过程中若发生节点失效,不用停等恢复失效节点上的数据,而用冗余节点替换失效节点,使计算能继续进行。最终的正确结果可以通过一个线性变换求出。为了论证方案的有效性,我们结合MPICH 的容错特性实现了容错的High Performance Linpack (HPL),并评估了方案的性能。实验结果表明,即使在小规模下,我们的方案的性能也明显优于算法失效恢复技术。

提交时间: 2016-06-08 点击量933下载量713 评论 0

5. chinaXiv:201606.00050 [pdf]

大规模众核体系结构的并行模拟

叶笑春; 范东睿; 陈明宇; 吕慧伟
分类: 计算机科学 >> 计算机软件

随着芯片内部处理器核数的增多,多核处理器逐渐有向众核方向发展的趋势。而众核这一全新的体系结构给计算机模拟带来了挑战。串行模拟已经难以满足速度的需求,必须充分利用现有并行宿主机的多核资源,在保证不损失模拟精度的前提下提升模拟速度。本文以众核和众核集群两种体系结构为例,说明并行模拟技术在计算机并行体系结构模拟中的必要性和可行性,在众核模拟中,做到精度不变,模拟速度提升10 倍;在众核集群模拟中,所模拟的处理器小核总数达到千核规模,并实现了混合的编程运行环境,为该结构的可扩展性测试提供了基础。

提交时间: 2016-06-08 点击量726下载量521 评论 0

6. chinaXiv:201605.00591 [pdf]

一种低开销软硬件混合的细粒度内存

陈荔城; 崔泽汉; 包云岗; 陈明宇; 黄永兵; 谭光明
分类: 计算机科学 >> 计算机应用技术

内存行为分析是进行内存系统调度、体系结构及应用访存性能等优化的基础,而细粒度的内存行为 分析能够标识内存系统性能瓶颈的源头,并为优化提供丰富的语义信息。常用的内存行为分析手段包括插 桩、模拟器、硬件计数器等,但它们分别存在开销大,准确性不足,无法提供详细信息等问题。本文提出 了一种软硬件混合的细粒度内存行为分析方法,能够对程序的完整访存序列进行函数级和对象级分析。硬 件方面使用HMTT 卡监控系统访存请求,软件方面采用二进制插桩方式来获取函数入口、出口信息,通过 导出内核页表及对象内存分配信息来得到每个对象的内存空间信息。实验结果表明,本文提出的方法能够 以较低的开销,准确地获取真实系统上的函数及对象级的访存序列。

提交时间: 2016-05-04 点击量1056下载量662 评论 0

7. chinaXiv:201605.00590 [pdf]

数据中心全系统模拟方法研究

胡农达; 付斌章; 隋秀峰; 李龙; 朱晓东; 李涛; 陈明宇; 张立新
分类: 计算机科学 >> 计算机应用技术

随着云计算的发展,数据中心快速崛起并给设计者和管理者带来了很多新的挑战。模拟作为一种研究

提交时间: 2016-05-04 点击量1086下载量657 评论 0

  [1 页/ 7 条记录]