您当前的位置:首页 > 论文浏览
您选择的条件: 李佳佳(4)

1. chinaXiv:201703.00208 [pdf]

CPU/ATI GPU混合体系结构上DGEMM的性能研究

李佳佳; 李兴建; 谭光明
分类: 计算机科学 >> 计算机硬件技术

本文报道了我们在 CPU/ATI GPU 混合体系结构上优化双精度矩阵乘法(DGEMM)的工作。在真 实应用中, CPU 与图形处理器(GPU)之间的数据传输是影响性能的关键因素。由于软件流水可以降低 数据传输开销,我们提出了三种软件流水算法,分别是双缓存(Double Buffering)、数据重用(Data Reuse) 和数据存储优化(Data Placement)。在 AMD 公司的图形处理器(GPU)ATI HD5970 上,优化后 DGEMM 性能达到 758 GFLOP/s,对应效率为 82%,是 ACML-GPU v1.1 性能的两倍。在 Intel Westmere EP 和 ATI HD5970 组成的异构系统上,性能达到 844 GFLOP/s,效率为 80%。我们进一步考察了多个 CPU 和多个 GPU 上 DGEMM 的扩展性,详细分析了体系结构方面的影响因素。分析表明,PCIe 总线和内存总线的竞争是异 构系统上程序性能降低的重要影响因素。

提交时间: 2017-03-10 点击量846下载量672 评论 0

2. chinaXiv:201611.00855 [pdf]

选择最优存储格式实现稀疏矩阵乘法的研究

李佳佳; 张秀霞; 谭光明; 陈明宇
分类: 计算机科学 >> 计算机应用技术

稀疏矩阵向量乘法是科学和工程领域中重要的核心子程序之一,也是稀疏BLAS(Basic Linear AlgebraSubprograms,基本线性代数子程序)库的重要组成。本文提出一个稀疏矩阵向量乘法的自动调优器SMAT。对于一个给定的稀疏矩阵,SMAT 可以选择并返回最优的存储格式。我们使用佛罗里达大学的2316 个稀疏矩阵作为测试集,SMAT 获得性能达到所选格式最好性能96%以上。SMAT 在Intel X5680 平台上的预测准确率为89.34% (单精度)和 86.18%(双精度),在AMD Opteron 6168 平台上准确率达到了85.10%(单精度)和82.09%(双精度)。同时,SMAT 的在线搜索时间在需要调用上百次稀疏矩阵向量乘法的应用中是可以接受的。

提交时间: 2016-11-15 点击量7503下载量2894 评论 0

3. chinaXiv:201611.00468 [pdf]

十八硫醇自组装膜对电偶腐蚀的抑制作用

万俐; 杜伟; 李佳佳; 丁毅; 陈步荣
分类: 材料科学 >> 材料科学(综合)

针对错银铜器的青铜-银电偶腐蚀问题,采用十八硫醇(ODT)的乙醇溶液在青铜和银表面制备了自组装膜(SAMs)。通过测量青铜-银的电偶对电流,研究了自组装前后的电偶腐蚀性能,并且采用X光电子能谱(XPS)、Tafel极化曲线法和微分电容法初步研究了ODT SAMs的作用机理。结果表明:ODT分子通过硫原子与基体形成硫醇盐,吸附在青铜和银表面形成自组装膜,该自组装膜在3.5%NaCl溶液中具有良好的电化学稳定性,能够有效抑制青铜和银之间的电偶腐蚀,属于混和抑制型缓蚀剂。

提交时间: 2016-11-09 来自合作期刊:《中国腐蚀与防护学报》 点击量445下载量393 评论 0

4. chinaXiv:201606.00051 [pdf]

CPU/ATI GPU 混合体系结构上DGEMM 的性能研究

李佳佳; 李兴建; 谭光明
分类: 计算机科学 >> 计算机软件

本文报道了我们在CPU/ATI GPU 混合体系结构上优化双精度矩阵乘法(DGEMM)的工作。在真实应用中, CPU 与图形处理器(GPU)之间的数据传输是影响性能的关键因素。由于软件流水可以降低数据传输开销,我们提出了三种软件流水算法,分别是双缓存(Double Buffering)、数据重用(Data Reuse)和数据存储优化(Data Placement)。在AMD 公司的图形处理器(GPU)ATI HD5970 上,优化后DGEMM性能达到758 GFLOP/s,对应效率为82%,是ACML-GPU v1.1 性能的两倍。在Intel Westmere EP 和ATIHD5970 组成的异构系统上,性能达到844 GFLOP/s,效率为80%。我们进一步考察了多个CPU 和多个GPU上DGEMM 的扩展性,详细分析了体系结构方面的影响因素。分析表明,PCIe 总线和内存总线的竞争是异构系统上程序性能降低的重要影响因素。

提交时间: 2016-06-08 点击量1015下载量796 评论 0

  [1 页/ 4 条记录]