您选择的条件: 陈明宇
  • DASICS-安全处理器设计白皮书

    分类: 计算机科学 >> 信息安全 提交时间: 2023-04-18

    摘要: 开源、共享和协同的软件开发模式促进了互联网、人工智能等领域繁荣发展,但在这种模式下软件开发的复杂性日益增加,体现在依靠大量开发者共同开发一个软件、频繁调用第三方代码库以及管理维护庞大的整体代码量。这种复杂的软件开发模式导致了在开发层面很大概率会引入安全漏洞。例如软件开发者不可避免地需要调用第三方代码库,却缺乏对第三方代码库的安全性的保证,导致了由于调用不可靠的第三方代码库引入了可以被攻击者利用的漏洞,带来信息泄漏和篡改的风险。一旦一个经常使用的第三发库发现漏洞,受影响的往往是大量使用这个库开发的软件。软件安全漏洞中最主要是内存访问漏洞。针对这些内存访问漏洞带来的软件安全挑战,学术界和工业界提出了一系列软硬件内存防护方法。这些防护方法一方面通过数据流完整性技术(Data Flow Integrity,简称 DFI),对非可信的软件代码的数据流进行严格的检查和限制,通过对数据边界的越界检查或者数据来源的合规性检查等来防止对内存的非法操作。这其中代表性的工作包括工业界中 Intel 公司提出的 MPX 和 MPK 技术、ARM 公司的 MTE 技术以及英国剑桥大学主导的 CHERI 安全体系结构等。另一方面通过控制流完整性技术(Control Flow Integrity,简称 CFI)来防止恶意的控制流劫持,例如 Intel 的 CET 技术、ARM 公司的 BTI 技术和 PA 等技术。但是这些内存防护方法不同程度地存在着隔离划分对象粒度过粗、安全元数据容易遭受攻击或者硬件实现/性能开销过大以及需要对现有第三方代码进行大幅修改和重新编译的问题。我们提出了 DASICS 安全处理器设计方案,以解决现有安全防护技术的隔离对象粒度过粗、元数据安全性低、性能开销过大的问题,并关注先前工作较少关注的权限动态划分、同一级地址空间内的内存保护和跨层调用检查。实现一种基于代码片段做权限动态划分的安全处理器设计,提供硬件辅助的高效软件内存防护,保障第三方代码的安全调用和运行,为基于开源开放的软件开发提供坚实的安全保障和支撑。

  • DASICS-安全处理器设计白皮书

    分类: 计算机科学 >> 计算机体系结构 分类: 计算机科学 >> 信息安全 提交时间: 2023-04-18

    摘要: 开源、共享和协同的软件开发模式促进了互联网、人工智能等领域繁荣发展,但在这种模式下软件开发的复杂性日益增加,体现在依靠大量开发者共同开发一个软件、频繁调用第三方代码库以及管理维护庞大的整体代码量。这种复杂的软件开发模式导致了在开发层面很大概率会引入安全漏洞。例如软件开发者不可避免地需要调用第三方代码库,却缺乏对第三方代码库的安全性的保证,导致了由于调用不可靠的第三方代码库引入了可以被攻击者利用的漏洞,带来信息泄漏和篡改的风险。一旦一个经常使用的第三发库发现漏洞,受影响的往往是大量使用这个库开发的软件。软件安全漏洞中最主要是内存访问漏洞。针对这些内存访问漏洞带来的软件安全挑战,学术界和工业界提出了一系列软硬件内存防护方法。这些防护方法一方面通过数据流完整性技术(Data Flow Integrity,简称 DFI),对非可信的软件代码的数据流进行严格的检查和限制,通过对数据边界的越界检查或者数据来源的合规性检查等来防止对内存的非法操作。这其中代表性的工作包括工业界中 Intel 公司提出的 MPX 和 MPK 技术、ARM 公司的 MTE 技术以及英国剑桥大学主导的 CHERI 安全体系结构等。另一方面通过控制流完整性技术(Control Flow Integrity,简称 CFI)来防止恶意的控制流劫持,例如 Intel 的 CET 技术、ARM 公司的 BTI 技术和 PA 等技术。但是这些内存防护方法不同程度地存在着隔离划分对象粒度过粗、安全元数据容易遭受攻击或者硬件实现/性能开销过大以及需要对现有第三方代码进行大幅修改和重新编译的问题。我们提出了 DASICS 安全处理器设计方案,以解决现有安全防护技术的隔离对象粒度过粗、元数据安全性低、性能开销过大的问题,并关注先前工作较少关注的权限动态划分、同一级地址空间内的内存保护和跨层调用检查。实现一种基于代码片段做权限动态划分的安全处理器设计,提供硬件辅助的高效软件内存防护,保障第三方代码的安全调用和运行,为基于开源开放的软件开发提供坚实的安全保障和支撑。

  • 一种新型高效的算法级容错技术及实现

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2017-03-10

    摘要: 随着高性能计算系统规模的不断扩大,节点失效愈加频发。传统的容错技术大都基于检查点 (checkpoint)方式。但是,检查点技术的开销随着系统规模的扩大而不断增加,在百亿亿次(Exaflops) 规模下其容错效率难以满足系统需求。算法失效恢复技术相比检查点方式具有更高的效率。然而,该技术依然基于停等模式。对于大规模系统,停等模式在很大程度上会影响程序的并行效率。本文提出了一种非 停等的算法级容错策略——热替换策略。在程序运行过程中若发生节点失效,不用停等恢复失效节点上的 数据,而用冗余节点替换失效节点,使计算能继续进行。终的正确结果可以通过一个线性变换求出。为 了论证方案的有效性,我们结合 MPICH 的容错特性实现了容错的 High Performance Linpack (HPL),并评估 了方案的性能。实验结果表明,即使在小规模下,我们的方案的性能也明显优于算法失效恢复技术。

  • 大规模众核体系结构的并行模拟

    分类: 计算机科学 >> 计算机体系结构 提交时间: 2017-03-10

    摘要: 随着芯片内部处理器核数的增多,多核处理器逐渐有向众核方向发展的趋势。而众核这一全新的体系结构给计算机模拟带来了挑战。串行模拟已经难以满足速度的需求,必须充分利用现有并行宿主机的多核资源,在保证不损失模拟精度的前提下提升模拟速度。本文以众核和众核集群两种体系结构为例,说明并行模拟技术在计算机并行体系结构模拟中的必要性和可行性,在众核模拟中,做到精度不变,模拟速度 提升 10 倍;在众核集群模拟中,所模拟的处理器小核总数达到千核规模,并实现了混合的编程运行环境, 为该结构的可扩展性测试提供了基础。

  • 选择最优存储格式实现稀疏矩阵乘法的研究

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-11-15

    摘要: 稀疏矩阵向量乘法是科学和工程领域中重要的核心子程序之一,也是稀疏BLAS(Basic Linear AlgebraSubprograms,基本线性代数子程序)库的重要组成。本文提出一个稀疏矩阵向量乘法的自动调优器SMAT。对于一个给定的稀疏矩阵,SMAT 可以选择并返回最优的存储格式。我们使用佛罗里达大学的2316 个稀疏矩阵作为测试集,SMAT 获得性能达到所选格式最好性能96%以上。SMAT 在Intel X5680 平台上的预测准确率为89.34% (单精度)和 86.18%(双精度),在AMD Opteron 6168 平台上准确率达到了85.10%(单精度)和82.09%(双精度)。同时,SMAT 的在线搜索时间在需要调用上百次稀疏矩阵向量乘法的应用中是可以接受的。

  • 一种新型高效的算法级容错技术及实现

    分类: 计算机科学 >> 计算机软件 提交时间: 2016-06-08

    摘要: 随着高性能计算系统规模的不断扩大,节点失效愈加频发。传统的容错技术大都基于检查点(checkpoint)方式。但是,检查点技术的开销随着系统规模的扩大而不断增加,在百亿亿次(Exaflops)规模下其容错效率难以满足系统需求。算法失效恢复技术相比检查点方式具有更高的效率。然而,该技术依然基于停等模式。对于大规模系统,停等模式在很大程度上会影响程序的并行效率。本文提出了一种非停等的算法级容错策略——热替换策略。在程序运行过程中若发生节点失效,不用停等恢复失效节点上的数据,而用冗余节点替换失效节点,使计算能继续进行。最终的正确结果可以通过一个线性变换求出。为了论证方案的有效性,我们结合MPICH 的容错特性实现了容错的High Performance Linpack (HPL),并评估了方案的性能。实验结果表明,即使在小规模下,我们的方案的性能也明显优于算法失效恢复技术。

  • 大规模众核体系结构的并行模拟

    分类: 计算机科学 >> 计算机软件 提交时间: 2016-06-08

    摘要: 随着芯片内部处理器核数的增多,多核处理器逐渐有向众核方向发展的趋势。而众核这一全新的体系结构给计算机模拟带来了挑战。串行模拟已经难以满足速度的需求,必须充分利用现有并行宿主机的多核资源,在保证不损失模拟精度的前提下提升模拟速度。本文以众核和众核集群两种体系结构为例,说明并行模拟技术在计算机并行体系结构模拟中的必要性和可行性,在众核模拟中,做到精度不变,模拟速度提升10 倍;在众核集群模拟中,所模拟的处理器小核总数达到千核规模,并实现了混合的编程运行环境,为该结构的可扩展性测试提供了基础。

  • 一种低开销软硬件混合的细粒度内存

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-05-04

    摘要: 内存行为分析是进行内存系统调度、体系结构及应用访存性能等优化的基础,而细粒度的内存行为 分析能够标识内存系统性能瓶颈的源头,并为优化提供丰富的语义信息。常用的内存行为分析手段包括插 桩、模拟器、硬件计数器等,但它们分别存在开销大,准确性不足,无法提供详细信息等问题。本文提出 了一种软硬件混合的细粒度内存行为分析方法,能够对程序的完整访存序列进行函数级和对象级分析。硬 件方面使用HMTT 卡监控系统访存请求,软件方面采用二进制插桩方式来获取函数入口、出口信息,通过 导出内核页表及对象内存分配信息来得到每个对象的内存空间信息。实验结果表明,本文提出的方法能够 以较低的开销,准确地获取真实系统上的函数及对象级的访存序列。

  • 数据中心全系统模拟方法研究

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-05-04

    摘要: 随着云计算的发展,数据中心快速崛起并给设计者和管理者带来了很多新的挑战。模拟作为一种研究