Current Location:home > Browse

1. chinaXiv:201904.00018 [pdf]

利用稀疏语义结合双层深度卷积神经网络的敏感图像检测方法

如先姑力·阿布都热西提; 亚森·艾则孜; 孙国梓
Subjects: Computer Science >> Integration Theory of Computer Science

互联网技术的飞速发展导致敏感内容图像由原先基本隐蔽的内容交换变为海量的数据共享, 传统基于图像特征提取的敏感内容检测方法不再适用。针对上述难点,提出基于稀疏语义和双层深度卷积神经网络相结合的敏感内容检测方法。上层网络首先进行训练样本的预处理,并通过构造图像的稀疏语义表示作为神经网络的输入,而下层网络则进一步考虑第三方管控机制(如政府代理等),提出针对特定群体的敏感内容图像检测方法。与现有常用敏感内容图像检测方法相比,提出的检测方法可有效降低训练样本数量,且检测精度比传统图像检测方法(如基于视觉词袋方法等)提升7%以上。

submitted time 2019-04-01 From cooperative journals:《计算机应用研究》 Hits762Downloads354 Comment 0

2. chinaXiv:201810.00040 [pdf]

维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法

如先姑力·阿布都热西提; 亚森·艾则孜; 郭文强
Subjects: Computer Science >> Integration Theory of Computer Science

随着新疆地区网络的建设发展,产生了大量维吾尔语网页。为了构建健康网络环境,提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。

submitted time 2018-10-11 From cooperative journals:《计算机应用研究》 Hits551Downloads309 Comment 0

3. chinaXiv:201805.00368 [pdf]

维吾尔文论坛中基于术语选择和Rocchio分类器的文本过滤方法

如先姑力·阿布都热西提; 亚森·艾则孜; 艾山·吾买尔; 阿力木江·艾沙
Subjects: Computer Science >> Integration Theory of Computer Science

针对维吾尔文网页论坛中的文本过滤问题,提出一种基于术语选择和Rocchio分类器的文本过滤方法。首先,将论坛文本进行预处理以删除无用词,并基于N-gram 统计模型进行词干(术语)提取;然后,提出一种均衡考虑相关性和冗余性的均衡型互信息术语选择方法(BMITS),对初始术语集合进行降维,获得精简术语集;最后,将文本特征术语作为输入,通过Rocchio分类器进行分类,以此过滤掉论坛中的不良文本。在相关数据集上的实验结果表明,提出的方法能够准确地识别出不良类型文本,具有有效性。

submitted time 2018-05-18 From cooperative journals:《计算机应用研究》 Hits713Downloads427 Comment 0

  [1 Pages/ 3 Totals]