分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】通过构建简单数据样本, 解决传统网页类型识别方法效率低的难题。【方法】采用URL 特征作为识别依据, 抽取URL 信息构建训练集与测试集, 使用支持向量机(SVM)建立机器学习模型以提高识别效率。【结果】在同样的数据集上,该方法的准确率为91.2%, 优于其他识别方法。在效率性能方面, 该方法提升近60%。【局限】当遇到URL 特征不明显甚至完全相背的网站时, 识别准确率会大幅度降低。【结论】该方法在效率方面存在很大优势, 应用到采集系统中可提高采集效率。
分类: 数学 >> 数学(综合) 提交时间: 2017-06-22
摘要: 考虑股票选取的多因子问题,在传统模型的基础上,利用MATLAB软件建立使用加权回归(权由日期和涨跌幅综合决定)的股票基本面指标、技术指标对相对收益率的多因子模型,并且引入支持向量机作为风控,最终获得了一个收益较好的量化投资模型。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-12 合作期刊: 《计算机应用研究》
摘要: 针对癫痫发作给病人带来的巨大伤害,为临床治疗留下足够空余时间,提出一个可以预测癫痫发作的系统模型。对21名癫痫病人进行研究,提取具有较低算法复杂度的排列熵构成特征向量,将其输入支持向量机(support vector machine,SVM)训练出学习模型,用来识别发作期样本,利用投票机制充分考虑病人差异来判断所处状态,最终实现癫痫的实时预测。结果表明,其中81%的发作可以提前平均50多分钟预测到,且具有较低的误报率。为癫痫发作预测系统的理论研究打下坚实基础。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-12-13 合作期刊: 《计算机应用研究》
摘要: 随着智能终端设备的不断普及,微信、网络即时新闻、电商客户产品评论等富含极短文本数据的信息呈爆发式增长。为了有效提取极短文本中的关键特征信息,提出了一种基于支持向量机的极短文本分类模型。首先对原数据进行数据清洗并利用Jieba分词将清洗过的数据进行处理;再将处理后的数据存入数据库,通过TF-IDF进行文本特征的提取;同时,利用支持向量机对极短文本进行分类。经过(1-0)检验,验证了模型的有效性。实验以芜湖市社管平台中的9906条极短文本数据作为样本进行算法检验与分析。结果表明在分类准确率方面,该方法相比于朴素贝叶斯、逻辑回归、决策树等传统方法得到有效提高;在误分度与精确度指标上匹配结果更加均衡。
分类: 天文学 >> 天文学 提交时间: 2018-09-10 合作期刊: 《天文研究与技术》
摘要: 提出一种基于机器学习的食双星光变曲线自动分类算法。算法首先对数据进行预处理,将食双星光变曲线数据归一化,并通过滤波/插值降低噪声;随后使用快速傅里叶变换提取频率信号作为特征向量;利用特征向量训练支持向量机获得自动分类模型。使用Python实现算法并抓取CALEB和GCVS数据验证,分析特征向量、支持向量机核函数与惩罚系数对分类正确率的影响,优化后所得分类模型正确率达到92.8%(训练集)和89.0%(测试集),最后使用所得分类模型对第3方数据进行分类,正确率为88.8%,结果证明提出的分类算法有效性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】为更精确地识别网民态度, 监测网络舆情, 提出一种基于SVM 多特征融合的情感5 级分类方法。【方法】从词性特征、情感特征、句式特征、语义特征4 个方面, 提取动词、名词、情感词、否定词等14 个特征, 运用SVM 方法对微博情感进行5 级分类。【结果】实验结果表明, 该方法对情感5 级分类的准确率为82.40%,召回率为81.91%, F 值为82.10%。【局限】训练语料的规模有待进一步提高。【结论】该方法在情感5 级分类方面取得较好的效果。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】为更精确地识别网民态度, 监测网络舆情, 提出一种基于SVM 多特征融合的情感5 级分类方法。【方法】从词性特征、情感特征、句式特征、语义特征4 个方面, 提取动词、名词、情感词、否定词等14 个特征, 运用SVM 方法对微博情感进行5 级分类。【结果】实验结果表明, 该方法对情感5 级分类的准确率为82.40%,召回率为81.91%, F 值为82.10%。【局限】训练语料的规模有待进一步提高。【结论】该方法在情感5 级分类方面取得较好的效果。
分类: 地球科学 >> 地理学 提交时间: 2024-06-12 合作期刊: 《干旱区研究》
摘要: 为进一步恢复和重建蓄水工程建成前后土地利用变化的历史过程,更好掌握和预报土地利用转移方向,本文利用支持向量机理论开展了土地利用类型解译的适应性研究,通过梳理土地利用动态变化,剖析了蓄水工程建成前后土地利用结构的自适应调节能力和演变方向。结果表明:(1)依靠自学习和自适应等优势能力,支持向量机解译土地利用分类的总体精度高达91.7%、Kappa系数为0.90;除耕地生产者精度相对较低外,水体、林地等其他土地类型具有较高的分类识别能力。(2)利用谷歌地球引擎(GEE)平台梳理土地利用类型演变过程发现,受”三北防护林”工程二阶段(2001-2020年)等项目实施影响,建设用地,林地面积出现较大增幅,其中,林地面积较2000年实施初期增加了近5倍。(3)工程建设运行后林地和建设用地近2/3面积保持了原貌,水体和未利用土地受水利和城建工程影响,原貌类型超过65%以上面积变成了其他类型;“三北防护林”工程加快了林地面积的增加和草地植被覆盖度的提高,低覆盖度草地转移到中、高覆盖度草地的面积净增幅达48.0%、50.2%。
分类: 地球科学 >> 地理学 提交时间: 2024-05-20 合作期刊: 《干旱区地理》
摘要: 为及时准确地获取干旱区农作物种植信息,研究借助PIE-Engine Studio平台,以新疆焉耆盆地为研究区,基于2022年Sentinel-2影像和1948个野外定位采样数据提取农作物生育期内14种植被指数,使用See5.0决策树、随机森林(Random forest,RF)和多元回归(Multiple regression,MR)模型优选特征参数,结合支持向量机(Support vector machine,SVM)算法构建5种分类模型和5种样方分割方案进行农作物种植信息提取,通过目视解译和混淆矩阵对比分析分类结果,确定最佳分类方案。结果表明:(1)所有分类模型的总体精度(OA)和Kappa系数均在92.20%和0.9037以上,说明在PIE平台中使用SVM算法提取农作物信息是可行的。(2)SVM-有红边的OA和Kappa系数均值为93.77%和0.9236,比SVM-无红边方法提高了0.96%和0.0120。(3)相比于SVM-有红边方法,植被指数的引入提高了SVM-RF、SVM-MR和SVM-See5.0的OA和Kappa系数。(4)5种分类模型的OA和Kappa系数均值的大小关系为:SVM-RF>SVM-MR>SVM-See5.0>SVM-有红边>SVM-无红边,表明红边波段和植被指数的加入显著提高了农作物识别的精度,其中SVM-RF(8:2)为最佳分类模型,OA和Kappa系数分别为98.72%和0.9866。研究结果可为准确快速获取大尺度干旱区农作物信息提供新的思路和参考依据。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: 处理不平衡数据分类时,传统支持向量机技术(SVM)对少数类样本识别率较低。鉴于SVM+技术能利用样本间隐藏信息的启发,提出了多任务学习的不平衡SVM+算法(MTL-IC-SVM+)。MTL-IC-SVM+基于SVM+将不平衡数据的分类表示为一个多任务的学习问题,并从纠正分类面的偏移出发,分别赋予多数类和少数类样本不同的错分惩罚因子,且设置少数类样本到分类面的距离大于多数类样本到分类面的距离。UCI数据集上的实验结果表明,MTL-IC-SVM+在不平衡数据分类问题上具有较高的分类精度。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 充分利用形状蕴涵的语义信息进行三维形状的高层分析和理解是当前的热门话题。提出采用形状部件的上下文语义关系进行功能识别的方法,解决了当三维形状的几何特征和拓扑结构发生较大变化时形状部件的自动识别问题。首先,采用近似凸性分解技术将三维形状分割成具有独立语义的形状部件;然后,提出基于形状部件的上下文语义计算方法,并采用支持向量机实现形状部件自动识别。实验结果表明,相比于已有方法,可取得更高的部件匹配准确率和更低的分类错误率。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】为构建疾病预测模型, 以重度急性胰腺炎早期预警为例, 提出一种基于支持向量机的疾病预测模型构建方法。【方法】基于支持向量机LIBSVM3.11, 采用优化后的径向基核函数产生的分类器, 同时结合统计学单因素及多因素Logistic 回归分析方法, 进行特征变量选取, 提出一种简单易行的重度急性胰腺炎早期预警模型。【结果】所构建重度急性胰腺炎预警模型准确率达70.37%。最终纳入模型变量包括白细胞计数、血清钙离子、血清脂肪酶、收缩压、舒张压及胸腔积液。【局限】样本量有限, 主要采用支持向量机构建疾病预测模型, 未来可建立系统, 突出临床应用价值。【结论】支持向量机可构建疾病预测的最优模型, 进一步建立系统, 辅助临床决策。
分类: 医学、药学 >> 基础医学 提交时间: 2018-06-15 合作期刊: 《南方医科大学学报》
摘要: 目的 基于正常和恶性胃组织介电特性值的差异,运用支持向量机(SVM)对介电特性进行自动鉴别。方法 用开端同轴探 头法测量正常和恶性胃组织在42.58~500 MHz频率范围内的介电特性,并对测得的介电特性数据进行Cole-Cole模型拟合。接 收机操作特性(ROC)曲线分析法被用来对各频率点下介电常数、电导率和Cole-Cole 拟合参数的鉴别能力进行评估。SVM 被 用来对正常和恶性胃组织进行鉴别,鉴别正确率由k 折交叉验证进行计算。结果 在测量频率范围内,5个低端频率点下介电常 数的ROC 曲线下面积达到0.8 以上。这5 个频率下介电常数的组合作为特征值与SVM 结合取得了最高鉴别正确率84.38%,MATLAB运行时间为3.40 s。结论 本文提出的基于介电特性的恶性人体胃组织支持向量机辅助诊断方法具有可行性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-18 合作期刊: 《计算机应用研究》
摘要: 多任务多核学习已逐渐成为在线学习算法研究的热点。对于数据流的处理,现有的在线学习算法在准确性上有一定的欠缺,因此提出一种新的多任务多核在线学习模型用于提高数据流预测的准确性。在保持多任务多核学习的基础上,将其扩展到在线学习中,从而得到一个新的在线学习算法;同时为输入数据保持一定大小的数据窗口,用较小空间换取数据的完整性。实验部分对核函数的选取以及训练样本集的大小进行了较为详细的分析,通过对UCI数据和实际的机场客流量数据进行分析,很好地保障了流数据处理的准确性及实时性,有一定的实际应用价值。
分类: 医学、药学 >> 基础医学 提交时间: 2018-01-25 合作期刊: 《南方医科大学学报》
摘要: 目的 基于正常和恶性胃组织介电特性值的差异,运用支持向量机(SVM)对介电特性进行自动鉴别。方法 用开端同轴探 头法测量正常和恶性胃组织在42.58~500 MHz频率范围内的介电特性,并对测得的介电特性数据进行Cole-Cole模型拟合。接 收机操作特性(ROC)曲线分析法被用来对各频率点下介电常数、电导率和Cole-Cole拟合参数的鉴别能力进行评估。SVM被 用来对正常和恶性胃组织进行鉴别,鉴别正确率由k折交叉验证进行计算。结果 在测量频率范围内, 5个低端频率点下介电常 数的ROC曲线下面积达到0.8以上。这5个频率下介电常数的组合作为特征值与SVM结合取得了最高鉴别正确率84.38%, MATLAB运行时间为3.40 s。结论 本文提出的基于介电特性的恶性人体胃组织支持向量机辅助诊断方法具有可行性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】社交网络环境下的用户兴趣建模是好友推荐、精准营销的关键, 利用微博用户分享的图像, 提出一种基于图像语义的用户兴趣建模方法, 旨在更加准确地预测用户的真实兴趣。【方法】在获取新浪微博用户图像数据的基础上, 使用图像的高层语义表达用户兴趣特征, 基于这些特征使用SVM 训练得到图像语义分类器进行预测。【结果】实验结果表明, 本文建立的模型能够较为准确地预测用户真实兴趣, 169 位用户分类的准确率达到97.38%, 召回率为98.92%, F 值为98.14%。【局限】由于实验图像数据集有限, 未能完整地覆盖用户所有的兴趣类别。【结论】该模型能够基于用户分享的图像较为准确地预测用户兴趣, 表明了图像高层语义的有效性, 同时为图像高层语义应用研究提供了一定的理论和技术基础。
分类: 农、林、牧、渔 >> 农、林、牧、渔业科学其他学科 提交时间: 2023-02-17 合作期刊: 《智慧农业(中英文)》
摘要: 蛋白质、脂肪含量和体细胞数量作为牛乳收购中的重要参考指标,决定了牛乳的品质和价格。为 批量准确地对牛乳品质进行分级,提高乳企的生产效率,本研究以3216份荷斯坦牛牛乳样本为研究对象, 应用中红外光谱技术实现对收购过程中4种不同品质牛乳的检测分级。利用一阶导数和一阶差分对光谱进行 预处理,并结合竞争性自适应重加权算法(Competitive Adaptive Reweighted Sampling,CARS) 和随机蛙跳算 法(Shuffled Frog Leaping Algorithm,SFLA) 筛选出能代表不同牛乳的有效特征变量,建立支持向量机 (Support Vector Machine,SVM) 模型。其中,利用网格搜索法(Grid Search,GS)、遗传算法(Genetic Algo⁃ rithm,GA) 和粒子群算法(Particle Swarm Optimization,PSO) 对SVM模型的关键参数惩罚参数c和核 函数参数g进行优化。结果表明,SFLA算法总体上优于CARS算法,PSO优化SVM模型的效果最佳。一阶差 分预处理后,利用SFLA算法筛选特征变量建立的PSO-SVM模型,训练集准确率、测试集准确率和曲线下 面积(Area Under Curve,AUC) 分别为97.8%、95.6%和0.96489。该模型具有较高的准确率,在牛乳产业中 具有实际应用价值。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-28 合作期刊: 《计算机应用研究》
摘要: 针对粒子群算法存在后期趋同性严重、收敛速度缓慢以及易陷入局部极小点等缺点,将模式搜索算法引入粒子群算法,对支持向量机参数进行优化,应用于跌倒检测中。首先,使用穿戴式设备收集跌倒检测数据集,将初始数据进行均值滤波以消除噪声的影响;然后,滤波后的数据特征提取,将提取的多维数据使用奇异值分解算法进行降维;最后,降维后的数据将用来检验粒子群模式搜索算法的优劣。通过与支持向量机算法和支持向量机算法加粒子群算法进行对比,粒子群模式搜索算法在跌倒检测中特异性和灵敏度都得到了提高。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】借助深度学习理论, 解决传统特征选择方法容易导致特征项不明确、分类精度下降的问题。【方法】对中文新闻文本进行分类时, 使用降噪自动编码器构建一个深层网络来学习对文本的压缩及分布式的表示,并在网络最后一层采用SVM 算法将其分类到具体的类别中去。【结果】随着样本数目的增大, 分类准确率、召回率和F 值都在上升, 且比KNN 算法、BP 算法和SVM 算法取得了更优的分类效果, 平均分类准确率达到95%以上。【局限】数据量依然较小, 且并没有完全发挥深度学习并行处理大容量数据的优势。【结论】该方法能提高特征项提取的准确性, 并能提高分类效果。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义] 研究网络环境下大学生群体的信息偶遇敏感影响因素,以指导大学生群体提高信息偶遇能力,继而提升大学生信息素养。[方法/过程] 使用信息增益分析各影响因素与信息偶遇发生频次之间的相关性,构建敏感影响因素模型,并进一步利用支持向量机(SVM)建立信息偶遇频次预测模型。[结果/结论] 与发生信息偶遇最相关的10个影响因素分布于信息用户、偶遇信息、网络环境、情境因素4个维度;模型分类预测精度达82.96%,说明SVM对预测信息偶遇频次有良好效果。