分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-04-04
摘要: 文本分析处理日益变成重要的课题之一,关于 jieba 中文分词的示例已有许多,但 是关于日语语言分词的相关研究甚少,本文旨在介绍 Python 中 MeCab 库对日语进行分词的 功能,并且给出相关案例代码,以便根据需要实现日语分词功能。
分类: 核科学技术 >> 核科学与技术 提交时间: 2023-06-16
摘要: In certain exceptional cases, capillary samples must be used to measure X-ray absorption spectra (XAS). However, the inhomogeneous thickness of capillary samples causes XAS distortion. This study discusses the distortion and correction of the XAS curve caused by the inhomogeneous thickness of capillary samples. The relationship between the distorted XAS curve mdeq (measured values) and the real absorption coefficient msdeq (true values) of the sample was established. The distortion was slight and negligible when the vertical size (2h) of the X-ray beam spot was smaller than 60% of the capillary tubes inner diameter (2Rin). When h/Rin >1, X-ray leakage is inevitable and should be avoided during measurement. Partial X-ray leakage caused by an X-ray beam spot size larger than the inner diameter of the capillary tube leads to serious compressed distortion of the XAS curve. When h/Rin <1, the distorted XAS data were well corrected. Possible errors and their influence on the corrected XAS are also discussed. Simulations and corrections for distortions verify the feasibility and effectiveness of the corrected method.
分类: 数字出版 >> 新媒体 提交时间: 2023-10-08 合作期刊: 《中国传媒科技》
摘要: 本文描述了使用Python抓取动态加载页面的报表数据、更新Excel模板数据的全过程,从而实现公司周期性报表数据的自动填报。重点介绍了两个问题的解决方案:一是怎样获取JavaScript动态加载页面的数据;二是怎样部分更新Excel模板的数据。
分类: 天文学 >> 天文学 提交时间: 2019-09-18 合作期刊: 《天文研究与技术》
摘要: 测量集(MeasurementSet,MS)文件是成为射电天文领域的重要存储文件格式,并逐渐成为射电天文数据存储、分析与共享的标准格式,得到越来越多的天文数据处理软件如CASA、WSCLEAN等的支持,在ALMA、LOFAR等诸多射电望远镜系统中应用。但长期以来,MS格式在国内应用较少,技术规范文档非常缺乏。本文结合SKA工程桥接阶段相关工作需要,对MS格式的基本概念、目录结构和字段设计进行了介绍,在此基础上讨论了利用python-casacore调用底层casacore生成MS文件的方法,并将此功能封装到当前SKA的算法参考库(Algorithm Reference Library, ARL)。文中给出了利用ARL仿真观测生成MS文件的实例,并通过CASA软件对生成的MS文件成像,经过结果比对,验证了MS文件的正确性。本文的工作为SKA后续的成像实验、观测模拟和文件存储都提供了关键的保障,在满足SKA工程桥接阶段工作需要的同时,也为国内外射电天文数据处理工作提供了参考。
分类: 心理学 >> 应用心理学 提交时间: 2022-03-18
摘要: 本文以九九文章网为例,详细地介绍了大数据心理学研究方法。利用用户实验采集的文本数据,提取词频特征,训练机器学习模型,然后利用学习模型实现对爬取的九九文章网的文章对应的生活满意度进行预测,帮助大数据研究初学者对整个处理流程有直观的感受。本文通过具体实例,介绍了Python和情感词典用于文本的词频计算,利用scikit-learn库完成对机器学习模型训练、测试及应用,并结合附带的源程序,便于读者直接操作。本文初步介绍了基于文本词频的机器学习建模的大数据研究方法,对于其中技术的介绍较为基础,主要强调如何将技术进行应用,对技术原理的介绍较少。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]探究我国省级公共图书馆的公众评价现状,比较华东、华中、华南、华北、西北、西南、东北共7个地区31个省内39个省级公共图书馆的建设差异,为公共图书馆未来建设方向提供建议。[方法/过程]通过《中国公共图书馆事业发展基础数据概览》《中国图书馆年鉴2016》和中国人民共和国国家统计局网站获取公共图书馆客观评估数据,确定数据获取的几个维度,应用python网络爬虫技术获取我国省级公共图书馆在大众点评上的赋值评分和用户评论,应用频数分析、偏度分析、相关性分析和情感分析方法从读者视角分析我国公共图书馆评价各要素之间的关系,提出建设性建议。[结果/结论]通过数据分析得出研究结论:①均衡差异,涉及地区差异和评价内容差异;②增强对用户的吸引力,尤其是偏远地区;③关注用户情感倾向,重点关注读者关注的热点词,同时要注意消除负面情感带来的影响。
分类: 数字出版 >> 新媒体 提交时间: 2023-10-08 合作期刊: 《中国传媒科技》
摘要: 【目的】为了探索科技期刊编辑出版工作的整合方法。【方法】以Python为例,探索编程技术在科技期刊编辑出版中的应用效果。【结果】Python编程技术应用在科技期刊编务工作中,可利用其自动化办公编程解决如自动制作录用通知并自动发送邮件等重复工作;利用Python可以实现专家库的自动更新和补充;利用Python编程实现科技期刊的选题策划,甚至让科技期刊的编辑出版实现自动化均有可能。【结论】Python编程技术可以应用在科技期刊编辑出版流程中,简化工作流程,提高工作效率。
分类: 数字出版 >> 新媒体 提交时间: 2023-10-08 合作期刊: 《中国传媒科技》
摘要: 近年来,融合媒体建设已经形成一定规模。为评价融合媒体传播能力,本文根据拉斯韦尔的5W模型,分析融媒体的传播能力的影响因素,设计融媒体传播能力评价指标体系;然后通过模糊层次分析法对融媒体传播能力进行评价;最后利用Python进行评价指标数据的获取,评价方法的建模,并计算分析评价结果。
分类: 力学 >> 应用力学 提交时间: 2023-03-20 合作期刊: 《应用力学学报》
摘要: 在强外界载荷下,在海洋平台-立管多体系统中的海洋平台和立管间的相互耦合作用会加强。从而导致整个系统的非线性增强。考虑到动力定位海洋平台-立管多体系统的强非线性,结合真实的海上施工工程背景和凝集质量法,基于Python镶嵌编程和OrcaFlexAPI模块的组成以及运用规则,对OrcaFlex进行了局部的二次开发,建立了一种基于无迹卡尔曼滤波的UKF-PID控制的动力定位平台-立管多体耦合系统。最终建立了无迹卡尔曼滤波模式下PID控制的动力定位海洋平台-立管刚柔多体模型,并对该模型在特定海洋环境下进行了动态仿真。计算结果对于具体工程实践有着一定的指导意义。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 在数据生命周期框架下,创新性地提出一种从论文中采集社会科学数据创建和使用相关信息的方法,并深入研究其基本情况,为社会科学数据的研究提供新思路。[方法/过程] 以学科交叉性较强的物流研究领域2015-2020年的CSSCI收录的论文为样本,通过迭代式方法构建基于数据生命周期的"泛化-精确关键词词库",采集社会科学数据的相关信息,并结合社会科学数据外部环境信息,对社会科学数据的创建和使用进行全面研究。[结果/结论] 在采集论文中社会科学数据的创建和使用相关信息上,二次匹配数据采集规则具有可行性和高效性,互联网已经成为社会科学研究主要的数据搜集方式,不同研究主题的数据使用偏好不同,对于数据分析工具的使用普及度仍然较低。