您当前的位置:首页 > 论文浏览
您选择的条件: 计算机软件(6)

1. chinaXiv:201703.00905 [pdf]

Applying Ricci flow to Manifold Learning

Li, Yangyang; Lu, Ruqian
分类: 计算机科学 >> 计算机软件

Traditional manifold learning algorithms often bear an assumption that the local neighborhood of any point on embedded manifold is roughly equal to the tangent space at that point without considering the curvature. The curvature indifferent way of manifold processing often makes traditional dimension reduction poorly neighborhood preserving. To overcome this drawback we propose a new algorithm called RF-ML to perform an operation on the manifold with help of Ricci flow before reducing the dimension of manifold.

提交时间: 2017-04-10 点击量1008下载量664 评论 0

2. chinaXiv:201703.00180 [pdf]

pSnort:基于多核处理器的并行入侵检测系统

贺鹏; 姜海洋; 谢高岗
分类: 计算机科学 >> 计算机软件

网络入侵检测与防御系统在当前的IP 网络安全领域中扮演着重要的角色,互联网流量的激增和单核处理器在数据包处理上存在的瓶颈,使得传统的运行于单核上的单线程网络入侵检测与防御系统已经远远不能满足网络发展的需求。为了解决这个问题,本文以主流单线程网络入侵检测与防御系统软件Snort 为基础,设计了一个基于软件流水的并行入侵检测系统pSnort,将传统的Snort 划分为2 个阶段,通过将其中最耗时的处理阶段并行化,以达到提升性能的目的。同时,通过程序设计,pSnort 避免了由于并行化而带来的严重的同步/互斥问题。经过试验,pSnort在Intel Quad-core Xeon 通用平台上可以获得超过1Gbps 的包处理速度。相对于传统的Snort,pSnort 最高能获得147%的性能提升以及2.5 倍加速比。

提交时间: 2017-03-09 点击量853下载量700 评论 0

3. chinaXiv:201606.00053 [pdf]

一种新型高效的算法级容错技术及实现

王睿; 姚二林; 陈明宇; 谭光明
分类: 计算机科学 >> 计算机软件

随着高性能计算系统规模的不断扩大,节点失效愈加频发。传统的容错技术大都基于检查点(checkpoint)方式。但是,检查点技术的开销随着系统规模的扩大而不断增加,在百亿亿次(Exaflops)规模下其容错效率难以满足系统需求。算法失效恢复技术相比检查点方式具有更高的效率。然而,该技术依然基于停等模式。对于大规模系统,停等模式在很大程度上会影响程序的并行效率。本文提出了一种非停等的算法级容错策略——热替换策略。在程序运行过程中若发生节点失效,不用停等恢复失效节点上的数据,而用冗余节点替换失效节点,使计算能继续进行。最终的正确结果可以通过一个线性变换求出。为了论证方案的有效性,我们结合MPICH 的容错特性实现了容错的High Performance Linpack (HPL),并评估了方案的性能。实验结果表明,即使在小规模下,我们的方案的性能也明显优于算法失效恢复技术。

提交时间: 2016-06-08 点击量933下载量713 评论 0

4. chinaXiv:201606.00052 [pdf]

流量感知的可重构路由算法

付斌章; 韩银和; 李华伟; 李晓维
分类: 计算机科学 >> 计算机软件

在众核处理器系统中,片上网络常被用来提供高带宽、低延迟、高可靠的片上网络通信。为了减少网络拥塞、提高网络性能,流量平衡路由算法获得研究人员的广泛关注。流量平衡算法通常利用完全自适应路由算法来提供路径分集,而当前的完全自适应路由算法或者需要较多的虚通道或者假设一个保守的流控策略。一方面虚通道是比较昂贵的资源,另一方面保守的流控策略则有可能造成网络性能的下降。因此研究人员提出利用应用程序的流量信息来提升路由性能。这些算法在不使用虚通道的基础上可以针对不同的流量特性进行重构,从而实现路由自适应度的按需分配。按照使用的流量信息类型,流量感知的可重构路由算法可以分为离线和在线算法。离线算法需要事先知道程序的流量特征,因此他们大多针对应用程序定制的多核片上系统。在线算法则是根据在线收集的流量信息进行重构,因此可以用于通用处理器系统。本文将讨论最近国际上提出的两种著名的离线算法,并重点介绍本文作者在2011 年国际计算机体系结构大会(ISCA 11)上发表的基于算盘转向模型的在线可重构路由算法。

提交时间: 2016-06-08 点击量724下载量510 评论 1

5. chinaXiv:201606.00051 [pdf]

CPU/ATI GPU 混合体系结构上DGEMM 的性能研究

李佳佳; 李兴建; 谭光明
分类: 计算机科学 >> 计算机软件

本文报道了我们在CPU/ATI GPU 混合体系结构上优化双精度矩阵乘法(DGEMM)的工作。在真实应用中, CPU 与图形处理器(GPU)之间的数据传输是影响性能的关键因素。由于软件流水可以降低数据传输开销,我们提出了三种软件流水算法,分别是双缓存(Double Buffering)、数据重用(Data Reuse)和数据存储优化(Data Placement)。在AMD 公司的图形处理器(GPU)ATI HD5970 上,优化后DGEMM性能达到758 GFLOP/s,对应效率为82%,是ACML-GPU v1.1 性能的两倍。在Intel Westmere EP 和ATIHD5970 组成的异构系统上,性能达到844 GFLOP/s,效率为80%。我们进一步考察了多个CPU 和多个GPU上DGEMM 的扩展性,详细分析了体系结构方面的影响因素。分析表明,PCIe 总线和内存总线的竞争是异构系统上程序性能降低的重要影响因素。

提交时间: 2016-06-08 点击量943下载量757 评论 0

6. chinaXiv:201606.00050 [pdf]

大规模众核体系结构的并行模拟

叶笑春; 范东睿; 陈明宇; 吕慧伟
分类: 计算机科学 >> 计算机软件

随着芯片内部处理器核数的增多,多核处理器逐渐有向众核方向发展的趋势。而众核这一全新的体系结构给计算机模拟带来了挑战。串行模拟已经难以满足速度的需求,必须充分利用现有并行宿主机的多核资源,在保证不损失模拟精度的前提下提升模拟速度。本文以众核和众核集群两种体系结构为例,说明并行模拟技术在计算机并行体系结构模拟中的必要性和可行性,在众核模拟中,做到精度不变,模拟速度提升10 倍;在众核集群模拟中,所模拟的处理器小核总数达到千核规模,并实现了混合的编程运行环境,为该结构的可扩展性测试提供了基础。

提交时间: 2016-06-08 点击量725下载量521 评论 0

  [1 页/ 6 条记录]