ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

2022
2

按主题分类

按作者

吴佳华
2
钟茂生
1

按机构

江西师范大学
2

当前资源共 2条

隐藏摘要

点击量

时间

下载量

您选择的条件: 吴佳华

1. ChinaXiv:202207.00144
下载全文

面向低资源命名实体识别的CharBiLSTM-Att-CRF模型

分类：计算机科学 >> 自然语言理解与机器翻译提交时间： 2022-07-19

吴佳华

摘要：当标注数据较少时，现有模型受训练数据量少的限制，参数没有拟合到预期效果，导致在低资源命名实体识别任务中模型识别性能不佳。本文通过采用K折交叉验证法，使模型较好拟合数据。此外，本文在BiLSTM-CRF模型基础上融合多层字符特征信息和自注意力机制，结合K折交叉验证法，构建了CharBiLSTM-Att-CRF模型。本文提出的CharBiLSTM-Att-CRF模型在20%的CONLL2003和20%的BC5CDR的数据集上，F1值在BiLSTM-CRF模型基础上分别提升了7.00%、4.08%。该模型能较好地适应低资源命名实体识别任务。

同行评议状态:待评议

点击量 3573 下载量 414 评论 0
2. ChinaXiv:202201.00009
下载全文

面向低资源命名实体识别BiLSTM-BCRF模型

分类：计算机科学 >> 计算机科学技术其他学科提交时间： 2022-01-02

钟茂生吴佳华

摘要： [目的]当标注数据较少时，现有模型受训练数据量少的限制，参数没有拟合到预期效果，导致在低资源命名实体识别任务中模型识别性能不佳。[方法]本文提出一种融入伯努利分布(Bernoulli distribution)的新型损失函数，让模型较好拟合数据。此外，本文在BiLSTM-CRF模型基础上融合多层字符特征信息，结合基于伯努利分布的新型损失函数，构建了BiLSTM-BCRF模型。[结果]本文提出的BiLSTM-BCRF模型在20%的CoNLL2003和20%的BC5CDR的数据集上，F1值在BiLSTM-CRF模型基础上分别提升了6.16%、3.35%。[结论]该模型能较好地适应低资源命名实体识别任务。[局限]该模型识别专有名词的性能还有待提升。

同行评议状态:待评议

点击量 10252 下载量 719 评论 1

面向低资源命名实体识别的CharBiLSTM-Att-CRF模型

面向低资源命名实体识别BiLSTM-BCRF模型