Current Location:home > Browse

Institution

Your conditions: Computer Science(1,420)

1. chinaXiv:202010.00060 [pdf]

一种基于BERT和文本相似度的先进的ICD9术语标准化方法

刘宜佳; 纪斌; 余杰; 谭郁松; 马俊; 吴庆波
Subjects: Computer Science >> Natural Language Understanding and Machine Translation

ICD-9术语标准化任务旨在将医生在病历中记录的口语术语标准化为《国际疾病分类》(ICD-9)第九版中定义的标准术语。在本文中,我们首先提出一种基于BERT和文本相似度的方法(BTSBM),该方法将BERT分类模型与文本相似度计算算法相结合:1)使用N-gram算法为每种口语术语生成候选标准术语集(CSTS) ,用作下一步的训练数据集和测试数据集; 2)使用BERT分类模型对正确的标准术语进行分类。在这种BTSBM方法中,如果采用较大规模的CSTS作为测试数据集,则训练数据集也需要保持较大规模。但是,每个CSTS中只有一个正样本。因此,扩大规模将导致正负样本比例的严重失衡,这将严重降低系统性能。如果我们将测试数据集保持相对较小,则CSTS准确性(CSTSA)将大大降低,这将导致非常低的系统性能上限。为了解决上述问题,我们然后提出了一种优化的术语标准化方法,称为先进的BERT和基于文本相似性方法(ABTSBM),其中1)使用大规模初始CSTS来维持较高的CSTSA以确保较高的系统性能上限; 2)根据身体结构对CSTS进行降噪,以减轻正负样本的不平衡而不降低CSTSA; 3)引入focal loss损失函数以进一步促进正负样本的平衡。实验表明,ABTSBM方法的精度高达83.5%,比BTSBM高0.6%,而ABTSBM的计算成本比BTSBM低26.7%。

submitted time 2020-10-27 Hits1291Downloads160 Comment 0

2. chinaXiv:202010.00061 [pdf]

基于span分类模型的医学概念抽取方法

汤勇韬; 余杰; 李莎莎; 纪斌; 谭郁松; 吴庆波
Subjects: Computer Science >> Natural Language Understanding and Machine Translation

最近,如何构造电子病历(EMR)引起了研究人员的极大关注。从EMR中提取临床概念是EMR结构化的关键部分。临床概念提取的性能将直接影响与EMR结构化相关的下游任务的性能。但是,主流方法中,序列标记模型有一些缺点。基于序列标记的临床概念提取方法不符合人类的语言认知模型。同时,这种方法产生的提取结果很难与下游任务耦合,这将导致错误传播并影响下游任务的性能。为了解决这些问题,我们提出了一种基于span分类的方法,通过考虑字符序列的整体语义而不是每个字符的语义来提高临床概念提取任务的性能。我们将此模型称为span分类模型。实验表明,span分类模型在2012年i2b2 NLP挑战赛的语料库中获得了最佳的微观平均F1得分(81.22%),并获得了与2010年i2b2 NLP挑战赛的SOTA相当的F1得分(89.25%)。此外,我们的方法的性能始终优于序列标记模型,例如BiLSTM-CRF模型和softmax分类器。

submitted time 2020-10-27 Hits1154Downloads143 Comment 0

3. chinaXiv:202010.00067 [pdf]

融合基于注意力机制的span特定和上下文语义表示的基于span的实体和关系联合抽取

Bin Ji
Subjects: Computer Science >> Natural Language Understanding and Machine Translation

基于span的联合提取模型已显示出它们在实体识别和关系提取上的效率。 这些模型将文本span视为候选实体,并将span元组视为候选关系元组。 span语义表示在实体识别和关系提取中都是共享的,而现有模型无法很好地捕获这些候选实体和关系的语义。 为了解决这些问题,我们引入了基于span的联合提取框架和基于注意的语义表示。 特别地,注意力用于计算语义表示,包括span特定和上下文表示。 我们将进一步研究四种注意变量在生成上下文语义表示中的作用。 实验表明,我们的模型优于以前的系统,并在ACE2005,CoNLL2004和ADE上达到了最优的结果。

submitted time 2020-10-26 Hits1162Downloads158 Comment 0

4. chinaXiv:202009.00125 [pdf]

Small Private Online Judge: A New Tool for Empirical Education Research

祝云篪; 赵作翰; 童澄达; 夏小俊
Subjects: Computer Science >> Computer Application Technology

This paper puts forward the concept of Small Private Online Judge (SPOJ). Compared with Massive Open Online Judge (MOOJ), SPOJ has advantages in structured data acquisition of students' virtual behavior for its specific function and tight coupling with the classroom. SPOJ-based empirical education research can be conducted within "Acquisition-Analysis-Application" (3A) Framework. The case study of a SPOJ program clarifies the standard pattern of SPOJ-based 3A research and highlights the emergence of education-intelligence concept. The challenges of SPOJ-based empirical education research and implications of SPOJ are also discussed.

submitted time 2020-09-30 Hits22038Downloads4223 Comment 0

5. chinaXiv:202009.00060 [pdf]

基于难样本挖掘的孪生网络目标跟踪

亢洁; 孙阳; 沈钧戈
Subjects: Computer Science >> Integration Theory of Computer Science

为了解决全卷积孪生网络目标跟踪算法(SiamFC)在复杂环境下容易出现跟踪漂移甚至跟踪失败的问题,提出了一种基于难样本挖掘的孪生网络目标跟踪方法。该方法在SiamFC算法的基础上,首先利用特征融合模块进行特征融合,以提高特征表征的鲁棒性,然后引入一个新的损失函数,加强网络对难样本的学习能力并缓解正负样本不平衡的问题。为验证该方法的有效性,在OTB2015和GOT10k数据集上对算法进行测试实验。实验结果表明,在OTB2015数据集上该方法比SiamFC算法在成功率上提高2.6%,精度上提高2%在GOT10k数据集上该方法的mAO为0.429,相比SiamFC算法提高了3.7%,在光照变化、目标形变、相似背景干扰情况下具有更好的表现。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits2649Downloads297 Comment 0

6. chinaXiv:202009.00061 [pdf]

基于非对称双分支交互神经网络的水下生物识别

赵力; 宋威
Subjects: Computer Science >> Integration Theory of Computer Science

针对水底环境存在着可见度低、光照条件差、物种间特征差异不明显等问题,基于卷积神经网络,提出了一种新的非对称双分支水下生物分类模型。模型中交互分支利用不同的卷积神经网络中间层提取局部特征并通过交互模块对局部特征进行交互,增强分类模型的局部特征学习能力;卷积神经网络分支可以有效地学习到目标的全局特征,弥补交互分支中忽略的全局信息。在Fish4-Knowledge(F4K)、EILAT、RAMAS三个数据集上取得了98.9%、98.3%、97.9%的准确率,较前人方法有显著提高;视觉解释也验证了该模型可以有效地捕捉到局部特征并消除背景影响。最终显示,该模型在水下环境具有良好的分类性能。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits2616Downloads268 Comment 0

7. chinaXiv:202009.00062 [pdf]

基于生成式对抗网络的画作的图像合成方法

赵宇欣; 王冠
Subjects: Computer Science >> Integration Theory of Computer Science

画作的图像合成旨在将两个不同来源的图像分别作为前景和背景融合在一起,这通常需要局部风格迁移。现有的算法过程繁琐且耗时,不能做到实时的图像合成。针对这一缺点,提出了基于生成式对抗网络(GAN)的前向生成模型(PainterGAN)。PainterGAN的自注意力机制和U-net结构控制合成过程中前景的语义内容不变。同时,对抗学习保证逼真的风格迁移。在实验中,使用预训练模型作为PainterGAN的生成器,极大地节省了计算时间和成本。实验结果表明,比起已有的方法,PainterGAN生成了质量相近甚至更好的图像,生成速度也提升了400倍,在解决局部风格迁移问题上是高质量、高效率的。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits2458Downloads261 Comment 0

8. chinaXiv:202009.00063 [pdf]

基于深度残差反投影注意力网络的图像超分辨率

胡高鹏; 陈子鎏; 王晓明; 张开放; 黄增喜; 杜亚军
Subjects: Computer Science >> Integration Theory of Computer Science

针对多数单帧图像超分辨率(single image super-resolution,SISR)重建方法存在的特征信息发掘不充分、特征图各通道之间的相互依赖关系难以确定以及重建高分辨率(high resolution,HR)图像时存在重构误差等问题,提出了基于深度残差反投影注意力网络的图像超分辨率(SR)算法。即利用残差学习的思想缓解训练难度和充分发掘图像的特征信息,并使用反投影学习机制学习高低分辨图像之间的相互依赖关系,此外引入了注意力机制动态分配各特征图以不同的注意力资源从而发掘更多的高频信息和学习特征图各通道之间的依赖关系。实验结果表明了所提方法相比于多数单帧图像超分辨率方法,不仅在客观指标方面得到了显著的提升,而且重建的预测图像也具有更加丰富的纹理信息。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits2311Downloads271 Comment 0

9. chinaXiv:202009.00064 [pdf]

鲁棒可预测判别字典学习人脸识别方法

张健; 米建勋
Subjects: Computer Science >> Integration Theory of Computer Science

提出一种可预测判别K-SVD网络模型(DKSVDN)并用于人脸识别问题。该模型构造了一种新颖的字典结构,包含类别标签字典和描述字典,以兼顾判别和重构性能。相应的稀疏编码向量由标签编码向量和描述编码向量组成。针对样本稀疏编码时间效率低的问题,利用预测神经网络与判别字典学习模型协同训练的方法来加速预测稀疏编码。此外,针对DKSVDN还特别引入一种拟梦境的训练方法用于提升模型在训练集多样性不足时的鲁棒性。通过在主流人脸数据集上的对比实验证明了该模型的优良性能。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits2467Downloads258 Comment 0

10. chinaXiv:202009.00065 [pdf]

基于改进注意力迁移的实时目标检测方法

张弛; 刘宏哲
Subjects: Computer Science >> Integration Theory of Computer Science

目前深度神经网络模型需要部署在资源受限的环境中,故需要设计高效紧凑的网络结构。本文针对设计紧凑的神经网络提出一种基于改进注意力迁移的模型压缩方法(KE),主要使用一个宽残差教师网络(WRN)指导一个紧凑的学生网络(KENet),将空间和通道的注意力迁移到学生网络来提升性能,并将该方法应用于实时目标检测。在CIFAR上的图像分类实验验证了经过改进注意力迁移的知识蒸馏方法能够提升紧凑模型的性能,在VOC上的目标检测实验验证了模型KEDet具有很好的精度(72.7mAP)和速度(86FPS)。实验结果充分说明基于改进注意力迁移的目标检测模型具有很好的准确性和实时性。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits2439Downloads236 Comment 0

12345678910  Last  Go  [142 Pages/ 1420 Totals]