您当前的位置:首页 > 论文浏览

1. chinaXiv:201810.00017 [pdf]

基于双向LSTM和GBDT的中医文本关系抽取模型

罗计根; 杜建强; 聂斌; 熊旺平; 刘蕾; 贺佳
分类: 计算机科学 >> 计算机科学的集成理论

为解决采用Softmax作为长短期记忆网络分类器导致实体关系识别模型泛化能力不足,不能较好适用中医实体关系抽取等问题,提出一种融合梯度提升树的双向长短期记忆网络的关系识别算法(BILSTM-GBDT)。先采用word2vec对中医文本进行向量化表示,再利用基于注意力机制的双向长短期记忆网络提取高阶特征,最后采用集成分类模型梯度提升树作为特征分类器,提高关系识别效果。在中医等多个关系语料库上的实验结果表明,该模型与传统SVM方法、GBDT方法及其深度学习方法相比,均有更高的精确率、召回率和F值。

提交时间: 2018-10-11 来自合作期刊:《计算机应用研究》 点击量1672下载量152 评论 0

2. chinaXiv:201806.00118 [pdf]

融合降噪自编码器与BPSO的特征组合方法及其中医应用

黄灿奕; 杜建强; 聂斌; 曾青霞; 朱志鹏; 喻芳
分类: 计算机科学 >> 计算机科学的集成理论

离散二进制粒子群算法(BPSO)在各种离散优化问题中有着诸多优势,但其很容易由于非线性的问题陷入局部最优解,无法得到最佳特征子集。而降噪自编码器可通过多层非线性网络进行映射与重构,对中医药数据有良好的处理效果。因此提出了一种融合降噪自编码器与BPSO的特征组合方法,该方法主要是利用降噪自编码器对特征进行非线性映射形成超完备基,然后在超完备基中通过BPSO进行搜索,从而得到最佳特征子集。分别采用临床糖尿病数据集和UCI数据集进行分析处理,实验结果表明,融合降噪自编码器与BPSO的特征组合方法对中医药临床实验数据有较好的适应性。

提交时间: 2018-06-19 来自合作期刊:《计算机应用研究》 点击量175下载量96 评论 0

3. chinaXiv:201805.00063 [pdf]

基于特征相关的偏最小二乘特征选择方法

曾青霞; 杜建强; 朱志鹏; 聂斌; 余日跃; 喻芳
分类: 计算机科学 >> 计算机科学的集成理论

针对传统的偏最小二乘法只考虑单特征的重要性以及特征之间存在冗余和多重共线性等问题,将特征之间的统计相关性引入到传统的偏最小二乘分析中,构造了一种基于特征相关的偏最小二乘模型。首先利用特征相关度对特征进行评估预选出特征组,然后将其放入偏最小二乘模型中进行训练,评估该特征组是否可取。结合前向贪心搜索策略依次评价候选特征,并选中使目标函数最小的候选特征加入到已选特征。分别采用麻杏石甘汤君药止咳、平喘和UCI数据集进行分析处理,实验结果表明,该特征选择方法能较好寻找较优的特征组。

提交时间: 2018-05-02 来自合作期刊:《计算机应用研究》 点击量176下载量108 评论 0

  [1 页/ 3 条记录]