ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

2022
1

按主题分类

自然语言理解与机器翻译
1

按作者

刘廷镇
1

按机构

腾讯IEG
1

当前资源共 1条

隐藏摘要

点击量

时间

下载量

您选择的条件: 刘廷镇

1. ChinaXiv:202208.00108
下载全文

用于探测深层语义的自然语言分解算法

分类：计算机科学 >> 自然语言理解与机器翻译提交时间： 2022-08-22

刘廷镇

摘要：认知科学研究认为，文本在被逻辑处理之前，首先会形成一种下意识理解。而这种下意识理解的概念域基于我们所处的社会文化环境而产生。文本传达的下意识情绪是表达中的重要组成部分，在文学写作、政治宣传、心理治疗等领域有着重要意义。然而目前文本倾向性分析研究主要着重于对文本进行逻辑理解，并不关注文本潜在表达的识别与构造。本文提出了一种一体两面的文本分解与文本生成算法，利用预训练语言模型分析与构造文本的潜在表达。不同于基于神经网络迁移学习的工作，本文的方法不需要对语言模型进行微调，而是利用语言模型表征的信息构建语义空间，并在语义空间上传播标记信息，这使得算法避免了深度学习的昂贵计算开销与训练的不稳定性。与目前多维度情感分析工作相比，文本分解部分允许用户自定义不同的分解目标，基于半监督学习方法，仅仅需要进行少量标记即可训练将文本分解为目标情绪分量上组分的可靠模型。文本生成部分可以基于分解部分标注的模型生成具有特定情绪分量的文本。与目前文本风格迁移工作相比，文本的生成模型不需要使用神经编解码器，因此有更高的效率和更好的可解释性。本文描述的算法是一套前瞻性的工具内核，其拥有可解释的推理过程，通过定义不同的分解目标，该方法可以被用于多维度情感分析、舆情监测等多种任务，也为大规模、自动化心理测量提供了一种可能。

同行评议状态:待评议

点击量 1083 下载量 413 评论

用于探测深层语义的自然语言分解算法