您当前的位置:首页 > 论文浏览

1. chinaXiv:201811.00131 [pdf]

基于多核FPGA的压缩文件密码破译

陈晓杰; 周清雷; 李斌
分类: 计算机科学 >> 计算机科学的集成理论

目前,破解WinRAR传统方法是使用CPU和GPU,而潜在的密码空间非常大,需要更高性能计算平台才能在有限的时间内找到正确的密码。因此,采用四核FPGA的硬件平台,实现高效能的WinRAR破解算法。通过在全流水架构下增加预计算和保留进位加法器结合的方法优化SHA-1算法,提升算法吞吐率;利用状态机的控制优化数据拼接,提升算法并行性;同时,采用异步时钟和多个FIFO缓存读写数据优化算法整体架构,降低算法内部的耦合度。实验结果表明,最终优化后的算法资源利用率为75%,频率达到200 MHz,4 bit长度的密码破译速度为每秒102 796个,是CPU破解速度的100倍,是GPU的3.5倍。

提交时间: 2018-11-29 来自合作期刊:《计算机应用研究》 点击量296下载量126 评论 0

2. chinaXiv:201805.00446 [pdf]

基于MD5-KNN的Wi-Fi室内定位算法研究

苗云龙; 陆彦辉; 尹峰; 杨守义
分类: 计算机科学 >> 计算机科学的集成理论

为降低RSSI指纹数据库中指纹数据量和AP数量对KNN算法的运算效率的影响,提出一种基于MD5-KNN的Wi-Fi室内定位算法,对大型场所构建的RSSI指纹数据库进行优化。在离线阶段,将RSSI指纹数据库中的每条指纹转换成包含32位16进制表示的MD5序列。在线上阶段,该算法完成定位所需时间与AP数量无关,且不随指纹数量的增加而线性增加,降低了定位所需时间和运算量。同时,该算法自适应的匹配出合适的K值,有效解决了RSSI-KNN算法需手动设定K值的问题。实验结果表明,该算法有效提高了基于Wi-Fi的室内定位技术的定位精度以及定位效率。

提交时间: 2018-05-24 来自合作期刊:《计算机应用研究》 点击量154下载量94 评论 0

3. chinaXiv:201805.00466 [pdf]

面向众核结构的并行Comba乘法研究

黄皓冉; 徐江峰
分类: 计算机科学 >> 计算机科学的集成理论

为发挥众核处理器性能优势及求解更大规模问题,针对大整数乘法在众核处理器上的并行化进行研究。在对笔算乘法和Comba乘法并行性进行分析的基础上,针对Comba乘法并行化时面临的负载均衡问题并提出了多种解决方法;然后针对SW26010的结构特征,选择借鉴笔算乘法改进的Comba乘法,并且实现过程使用了向量化、寄存器通信等优化方法。测试结果说明改进后的并行Comba算法具有较好的并行性,能够很好地利用SW26010众核处理器的性能优势。

提交时间: 2018-05-24 来自合作期刊:《计算机应用研究》 点击量131下载量80 评论 0

4. chinaXiv:201805.00399 [pdf]

利用帕累托非支配关系实现高效三目标差分进化的方法

许玉龙; 潘旭; 王忠义; 盛梦园; 王林景
分类: 计算机科学 >> 计算机科学的集成理论

在多目标进化算法中,时间复杂度过高是普遍的问题,特别是三个目标函数以上时,解的等级分配占用了过多运算时间。针对三目标问题,利用帕累托支配关系,对解的等级分配进行研究,发现经典的等级排序及分配方法存在一定冗余操作,需对全部的解先排序后,才能再分配等级并选择下一代,造成部分不必要的运算。为减少该冗余,利用帕累托非支配关系结合差分进化,实现高效三目标进化算法。算法每次迭代对种群中最高等级的个体进行计算,在分配等级同时进行选择后代个体操作,当后代种群生成时便跳出计算,从而减少个体的计算数量,降低运算量,同时给出该方法的相关理论分析和证明过程。然后,针对一系列三目标优化问题,将提出方法与著名排序方法NSGAII,及近年来优秀的ENS方法进行对比实验。仿真实验结果表明,提出方法在时间复杂度和收敛速度上优于经典方法,稍差于ENS方法。在标准测试函数DTLZ1-DTLZ6的性能上,提出方法近似于ENS方法,优于NSGAII算法,从而验证了提出方法的有效性和正确性。

提交时间: 2018-05-18 来自合作期刊:《计算机应用研究》 点击量130下载量81 评论 0

5. chinaXiv:201804.02400 [pdf]

基于拟态计算的大数据高效能平台设计方法

李斌; 周清雷; 斯雪明; 聂凯
分类: 计算机科学 >> 计算机科学的集成理论

针对当前大数据应用主要以通用处理器为计算核心,且系统结构单一、能效比低,无法充分满足大数据的计算需求。基于拟态计算模型,提出了一种大数据高效能平台的设计方法。该方法以算粒为基本研究对象,深入剖析大数据应用算法的特征,合理划分各计算子任务;其次,构造体系结构匹配矩阵,并将子任务分配到合理的处理部件上;最后,利用动态电压/频率调节技术和数据布局算法,实现非关键任务的电压控制,并优化关键任务的结构布局。实验结果表明,拟态计算能深度融合各异构计算部件,建立具有灵活、可拓展的体系结构,充分发挥系统整体执行效率,降低功耗,提高能效比。

提交时间: 2018-04-24 来自合作期刊:《计算机应用研究》 点击量279下载量181 评论 0

6. chinaXiv:201804.02068 [pdf]

基于卷积神经网络和Tree-LSTM的微博情感分析

王文凯; 王黎明; 柴玉梅
分类: 计算机科学 >> 计算机科学的集成理论

微博情感分析旨在研究用户关于热点事件的情感观点,研究表明深度学习在微博情感分析上具有可行性。针对传统卷积神经网络进行微博情感分析时忽略了非连续词之间的相关性,为此将注意力机制应用到卷积神经网络(CNN)模型的输入端以改善此问题。由于中文微博属于短文本范畴,卷积神经网络前向传播过程中池化层特征选择存在丢失过多语义特征的可能性,为此在卷积神经网络的输出端融入树型的长短期记忆神经网络(LSTM),通过添加句子结构特征加强深层语义学习。在两种改进基础上构造出一种微博情感分析模型(Att-CTL),实验表明该模型在微博情感分析上具有优良的特性,尤其在极性转移方面仍保持较高的F1值。

提交时间: 2018-04-19 来自合作期刊:《计算机应用研究》 点击量202下载量131 评论 0

7. chinaXiv:201804.02142 [pdf]

基于GMD-DPC/THP的两组Alamouti非线性预编码系统

尚应博; 赵悠悠; 穆晓敏; 张建康
分类: 计算机科学 >> 计算机科学的集成理论

针对Alamouti空时块编码复用增益损失的问题,提出了两组Alamouti编码方案;在此基础上,为了改善系统的误码率(bit error rate,BER)性能和简化接收端复杂度,提出将几何均值分解(geometric mean decomposition,GMD)算法和非线性预编码技术相结合的两组Alamouti传输方案。本方案的设计方法为:首先等效出两组Alamouti空时块编码系统的信道矩阵;进而,通过GMD算法对等效信道矩阵进行收发端联合设计;最后,在发射端应用脏纸(dirty paper coding,DPC)和Tomlinson-Harashima precoding(THP)非线性预编码技术,消除发送信号间的干扰,从而使系统获得更好的误码率性能。通过仿真结果对比发现,提出的系统可以显著地改善误码率性能。

提交时间: 2018-04-17 来自合作期刊:《计算机应用研究》 点击量154下载量99 评论 0

  [1 页/ 7 条记录]