Current Location:home > Browse

Institution

1. chinaXiv:202009.00102 [pdf]

基于混沌PSO的高维多视图数据IWKM聚类算法

陈高祥; 陈都鑫
Subjects: Computer Science >> Integration Theory of Computer Science

针对传统聚类算法无法处理大数据中多视图高维数据问题,提出了一种基于混沌粒子群优化算法的智能加权K均值聚类算法。首先,在聚类模型中引入聚类之间的耦合程度以扩大聚类的相似性。其次,为了消除初始聚类中心的敏感性,利用混沌粒子群优化算法通过全局搜索得到最优初始聚类中心、视图权重和特征权重。然后,引入一种精确摄动策略提高混沌粒子群优化算法的寻优性能。最后通过在apache spark和single node两个平台上的实验验证了提出的方法在视图多、维数高的复杂数据集条件下具有较好的聚类性能。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits266Downloads161 Comment 0

2. chinaXiv:202001.00075 [pdf]

基于大规模古文语料库的词典构建及分词技术研究

邢付贵; 朱廷劭
Subjects: Psychology >> Applied Psychology

古文献的研究有助于传统文化的继承与发扬,而古文分词则是利用自然语言处理技术对古文献进行分析的重要环节,但由于缺少规范的数据资料而没有像现代汉语分词取得突破性进展。当前互联网拥有大量古汉语文本和词典方面的数据资料,但是这些数据分散,没有得到有效地整合。本文提出采集互联网非结构化古汉语数据,经过数据清洗和预处理抽取出一个古汉语基础词典,然后再利用互信息、信息熵、位置成词概率相结合的新词发现方法从大规模古籍文本中抽取古汉语候补词典,最终将基础词典与候补词典融合,利用正向最大匹配实现对古文的分词。与开源的分词器甲言在基于词典的分词方面比较后F值提高了14%,取得了良好的效果,结果证明本文构建的分词器可以应用在古汉语文本分词上。

submitted time 2020-01-07 Hits18722Downloads2081 Comment 0

3. chinaXiv:201912.00001 [pdf]

基于大数据的文化心理分析

吴胜涛; 吴舒涵; 朱廷劭
Subjects: Psychology >> Psychological Measurement

本文旨在回顾研究者近年来使用大数据方法分析文化价值观以及社会变迁、生态地理效应的研究。在社会变迁方面,谷歌电子图书语料库、社交媒体和文学语料库被用来展示伴随城市化以及短期内经济放缓的文化变迁;在生态地理方面,研究者基于Twitter或新浪微博文本语料库,考察了“一带一路”沿线国家或地区的文化多样性,中国农村与城市地区的文化价值失调与主观幸福感,以及中国不同城市的空气污染与文化适应。此外,本文还讨论了传统研究方法和大数据分析法的结合使用,以及文化大数据分析的各种挑战和未来前景。

submitted time 2019-12-06 Hits4197Downloads1724 Comment 0

4. chinaXiv:201909.00146 [pdf]

基于POI数据的西宁市零售业空间格局探究

高子轶; 张海峰
Subjects: Geosciences >> Other Disciplines of Geosciences

零售业是城市商业结构中最有活力的组成部分,合理有序的零售空间结构对促进经济的发展、提高资源的配置、满足居民的生活需求至关重要。POI作为新的空间数据源,能够客观地、准确地对商业空间结构进行识别和探究。西宁市位于青藏高原东北部,是连接青藏高原与中国大陆的重要门户。西宁市集中大量的人口,且存在有潜力的消费市场。基于POI大数据,运用核密度、局域Getis-Ord G*指数、Ripley’s K函数和区位熵的分析方法,以西宁市为研究案例探究零售网点的空间分布特征。零售业详细地分为以下8种类型,分别是食品、饮料及烟草制品,纺织、服装及日用品,文化、体育用品及器材,家用电器及电子产品,五金、家具室内装饰材料,医药及医疗器材,汽车、摩托车燃料及零配件,综合零售。结果表明:西宁市零售业集聚区空间分布特征显著,呈现“多集聚、多核心”商业空间形态。密度等级由中心区沿交通干线逐渐向外围递减;高密度集聚区分别分布在水井巷附近街区、商业巷附近街区、祁连路—北禅路交汇的附近街区(北山市场)和以万达广场为核心的海湖新区。行业属性不同使得零售点集聚和分布变化表现出较大的差异性,与人们日常生活密切相关的业态零售点呈现社区化、微型化和便利化的特征,且区位选择性较大,如:食品饮料及烟草制品、医药及医疗器材和综合零售行业,而家用电器及电子产品、文化体育用品和纺织服装等行业区位选择尺度小,集中在特定的区域;基于道路数据构建的街区单元冷热点区域分布特征显著,它受城市建设用地扩张,人口密度,交通可达性和城市规划等因素的影响,海湖新区将成为最有发展潜力的商业区;在街道尺度,各业态零售业专业化功能区块显著,发展成熟的街道表现出多优势行业集聚特征,西宁市多业态集聚区域较少,只有人民街街道。这项研究一方面有助于填补基于POI数据青藏高原河谷型城市商业空间结构研究的空白; 另一方面,为政府战略制定,零售商选址和城市规划提供一些参考。

submitted time 2019-09-11 From cooperative journals:《干旱区地理》 Hits6649Downloads1048 Comment 0

5. chinaXiv:201905.00036 [pdf]

面向大数据复杂应用的虚拟集群动态部署模型

王瑾; 曹云鹏; 王海峰
Subjects: Computer Science >> Integration Theory of Computer Science

在大数据复杂应用中会出现多种计算模式混合的作业,因此虚拟集群需要维持多种计算模式的形态进行计算。针对计算负载的时变性和复杂性导致虚拟集群的资源利用率不高的问题。为提高虚拟集群资源的全局利用率,采用弹性资源管理策略来吸收多种计算模式混杂时的资源需求突变。在Docker容器技术的支持下提出一个根据作业需求变化的动态部署模型。该模型根据资源的动态需求变化,实时调整虚拟集群的计算形态,具体包括计算节点的类型及规模。该模型不仅实现用户作业执行环境的动态定制,而且达到错峰计算的目的。仿真实验表明该模型使得虚拟节点CPU利用率提升5.3%,并且优化了计算作业的执行效率。该动态部署模型适合应用到数据中心或大规模集群中,能够有效提高计算资源的利用率。

submitted time 2019-05-10 From cooperative journals:《计算机应用研究》 Hits1000Downloads510 Comment 0

6. chinaXiv:201901.00133 [pdf]

基于微博大数据分析时间取向与主观幸福感的关系

赵光义; 孟广腾; 井海洋; 毛浙飞; 朱廷劭
Subjects: Psychology >> Applied Psychology

人们在思考或行动上所偏好的时间方向在一定程度上影响行为,而行为会影响生活状态,据此我们希望探讨时间取向与人的主观幸福感是否有关。本研究利用微博大数据,收集了2010至2017年共64160名活跃用户的微博,通过关键词提取以及数据分析发现,主观幸福感与未来词频之间存在中等强度的相关(r = 0.404, p < 0.01),与现在词频及过去词频之间呈弱相关;将用户按时间取向词频分组后,高词频组的主观幸福感显著高于低词频组(t = 67.442 , p < 0.001),同时我们也发现了主观幸福感与时间取向词频均有逐年下降的趋势。研究结果说明未来时间取向可作为主观幸福感的预测指标,本研究为利用微博大数据预测心理健康提供了新的方向。

submitted time 2019-01-21 Hits6899Downloads2315 Comment 0

7. chinaXiv:201901.00120 [pdf]

基于微博数据的“空巢青年”情绪表达特征探究

王亚猛; 刘佳丽; 王静文; 臧奋英; 于祎雯; 朱廷劭
Subjects: Psychology >> Applied Psychology

[目的] 利用微博数据探索”空巢青年“与”非空巢青年“情绪表达的特征。 [方法] 本研究根据微博用户的活动状态, 从 100 万活跃用户中选出”空巢青年“组和“非空巢青年“组,比较两组用户在所发微博中情绪表达的差异。 [结果] 从独立样本t检验和双因素方差分析的结果中可以看出,“空巢青年”和“非空巢青年”情绪表达存在明显差异,根据地域和性别划分可以发现在情绪表达上也都存在差异。 [局限] 词频分析与用心理测量量表测量的情感无法完全等同,基于微博数据的词频分析虽然提供了一种高效的分析方法,但不能完全替代严格的心理测量。 [结论] “空巢”状态会影响情绪表达;“空巢青年”更倾向于表达内心的情绪。

submitted time 2019-01-21 Hits7219Downloads1909 Comment 0

8. chinaXiv:201901.00132 [pdf]

转发“锦鲤”行为对微博用户情绪的影响

唐子煌; 廖令秋; 李云箫; 张全; 苏悦; 赵金; 朱廷劭
Subjects: Psychology >> Applied Psychology

社交网络在如今的社会影响我们生活的方方面面,而在社交网上兴起的 某些具有“仪式”感的转发行为越来越多,其中“转锦鲤”就是最受欢迎的一种。 本研究利用网络文本分析对用户在转发锦鲤前后一个月的社交关键词进行分析,来研究转发“锦鲤”对微博用户情绪的影响。结果显示转发锦鲤的行为不能认为具有自我积极暗示的作用,或者是用户转发锦鲤这一行为本身不具积极自我暗示的成分。

submitted time 2019-01-21 Hits6771Downloads1625 Comment 0

9. chinaXiv:201901.00131 [pdf]

山竹台风影响下受灾群众心理状态的台风眼效应

朱致琛; 周意勇; 王宇宸; 卢江丰; 程羽慧; 何婷婷; 朱廷劭
Subjects: Psychology >> Applied Psychology

选取山竹台风典型受灾地区(广东)和非受灾地区(安徽)微博用户的行为数据,使用大数据分析的方法从时间和空间两个维度检验心理台风眼效应。结果发现,在时间维度上,受灾地区对台风的关注存在差异,但并没有表现出“高-低-高”的心理台风眼模式,具体来说,受灾地区在台风过境后对其关注程度高于台风过境前,而台风来临前与过境中、来临后与过境中对台风关注程度没有显著差异;在空间维度上,受灾地区和未受灾地区在对台风的关注度上不存在显著差异。本文对研究的局限性进行了分析,以期为未来研究提供相关思考和借鉴。

submitted time 2019-01-21 Hits5839Downloads1213 Comment 0

10. chinaXiv:201901.00118 [pdf]

山竹台风影响下受灾群众心理状态的台风眼效应

朱致琛; 周意勇; 王宇宸; 卢江丰; 程羽慧; 何婷婷; 朱廷劭
Subjects: Psychology >> Applied Psychology

选取山竹台风典型受灾地区(广东)和非受灾地区(安徽)微博用户的行为数据,使用大数据分析的方法从时间和空间两个维度检验心理台风眼效应。结果发现,在时间维度上,受灾地区对台风的关注存在差异,但并没有表现出“高-低-高”的心理台风眼模式,具体来说,受灾地区在台风过境后对其关注程度高于台风过境前,而台风来临前与过境中、来临后与过境中对台风关注程度没有显著差异;在空间维度上,受灾地区和未受灾地区在对台风的关注度上不存在显著差异。本文对研究的局限性进行了分析,以期为未来研究提供相关思考和借鉴。

submitted time 2019-01-21 Hits4484Downloads1885 Comment 0

12345  Last  Go  [5 Pages/ 49 Totals]