分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 对已有的文本表示、分类算法进行组合,遴选一种复杂度低、训练时间少的组合 方式,构建商品评论情感文本分类的优化模型。[ 方法 / 过程 ] 以 Keras API 为应用环境,将 Word2vec 词 向量输入 Embedding 嵌入层,依据句子词索引序列,通过控制 trainable 参数实现 3 种商品评论的文本表示; 将不同的文本表示分别与不同分类算法进行匹配,分析分类效果差异,确立较优算法组合。[ 结果 / 结论 ] Word2vec词向量输入Embedding嵌入层继续训练的文本表示方法,结合TextCNN算法训练获得的分类模型, 在商品评论测试集上分类效果表现较好,准确率和ROC曲线面积AUC值分别为94.02%、0.982 7。应用表明, 分类模型能较好实现商品评论的情感分类,有较好的分类泛化能力。