分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-10-11 合作期刊: 《计算机应用研究》
摘要: 针对解决双语剽窃的检测问题,给出了一种跨语言剽窃检测模型。该模型包括了基于多特征选择的跨语言剽窃分类和基于多特征对应的跨语言剽窃检测。该方法主要是根据译者在进行翻译时出现的欧化现象挖掘出常见的译文特征,在对特征进行进一步的特征选择和特征权值的计算后,训练分类器,针对是否存在跨语言剽窃行为进行分类,最后通过WordNet进行最后的剽窃确认。通过实验对比和实验分析,分别进行了分类结果和检测结果的验证,证明了所给出的模型的有效性和科学性。