ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

按主题分类

按作者

按机构

当前资源共 150条

隐藏摘要

点击量

时间

下载量

您选择的条件: 计算机应用技术

1. ChinaXiv:202404.00195
下载全文

基于大语言模型的中英文整合复杂性建模研究

分类：心理学 >> 应用心理学分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-10

李东启朱廷劭

摘要：整合复杂性是心理学中用来测量个体思维结构的一个概念，主要涉及两个方面：区分性和整合性。区分性是指个体能够识别和理解信息中存在的不同观点或元素的能力；整合性是指个体能够将这些不同的观点或元素合并成一个有逻辑性和连贯性的整体的能力。整合复杂性的测量主要依靠人工对于文本内容进行分析，这些文本可以是书面材料、演讲稿、面试记录或任何其他形式的口头或书面表达。针对当前整合复杂性人工测评方法成本高、自动化评估方法精度低以及缺乏中文文本评估方案等问题，本研究基于大语言模型文本数据增强技术和模型迁移技术为整合复杂性的评估设计了对于中英文文本的自动化评估方案，并探索了整合复杂性两种子结构：精细整合复杂性和辩证整合复杂性的自动化评估方法。本文设计并实施了两个研究，首先基于大语言模型文本数据增强技术实现了对于英文文本整合复杂性的预测模型，其次基于模型迁移技术实现了对于中文文本整合复杂性的预测模型。研究结果显示：1）使用GPT-3.5-Tubo对于英文文本数据进行增强，使用预训练多语言Roberta模型进行词向量提取，使用文本卷积神经网络模型作为下游模型。与人工标注相比，整合复杂性Spearman相关系数为0.62，辩证整合复杂性相关系数为0.51，精细整合复杂性Spearman相关系数为0.60。优于机器学习方法以及未经过数据增强的神经网络模型。2）本文在研究二中建立了与研究一中的神经网络结构一致的模型，并将研究一中最终的模型参数迁移至本研究的模型中，对于中文文本整合复杂性进行训练。在零样本的情况下，迁移学习模型整合复杂性Spearman相关系数为0.31，辩证整合复杂性Spearman相关系数为0.31，精细整合复杂性相关系数为0.33，均优于随机参数情况下的模型表现（整合复杂性：0.17，辩证整合复杂性：0.10，精细整合复杂性：0.10）。在小样本情况下迁移学习模型整合复杂性Spearman相关系数为0.73，辩证整合复杂性Spearman相关系数为0.51，精细整合复杂性相关系数为0.73。

同行评议状态:待评议

点击量 10 下载量 0 评论
2. ChinaXiv:202404.00141
下载全文

大模型与标准文献知识库的融合应用探索

分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-10

徐松林

摘要：在人工智能与大数据技术背景下，利用大模型及构建标准文献知识库对于科研创新、知识挖掘和信息检索具有重要价值。标准文献知识库为各行业的规范化、标准化提供了坚实的支撑。本研究首先探讨了标准文献的现状，然后基于检索增强搭建大模型与标准文献知识库集成的框架，并提出各阶段增强优化探索。最后展望了未来的研究方向和应用前景。

同行评议状态:待评议

点击量 262 下载量 62 评论
3. ChinaXiv:202404.00159
下载全文

简体中文LIWC2024(SCLIWC2024)词典的修订与验证

分类：心理学 >> 应用心理学分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-09

崔雪婷陈思仪赵楠刘晓倩朱廷劭

摘要：近年来，字词分析取向的方法逐渐受到重视，特别是语言探索与字词计数(Linguistic Inquiry and Word Count, LIWC)工具，它的问世让许多心理学家对语言分析研究重新燃起热情。最新版本LIWC-22词典的修订新增了许多心理变量，在增加了LIWC工具的应用潜力的同时也使其更加完善。为进一步推动LIWC工具中文化的进程，我们对多个版本的中文LIWC词典进行汇总，修订形成了SCLIWC2024，并对其效度进行了检验。研究一中，我们对照LIWC-22词典和CLIWC2015词典，以SCLIWC词典为基础，修订形成了SCLIWC2024词典。研究二中，我们进行了两项实验来检测SCLIWC2024在不同类型网络文本心理表达的有效性，并回答了如何更有效地使用SCLIWC2024来检测社交网络平台短文本的心理表达的重要问题。

同行评议状态:待评议

点击量 226 下载量 58 评论
4. ChinaXiv:202404.00111
下载全文

Multimodal Physical Fitness Monitoring (PFM) Framework Based on TimeMAE-PFM in Wearable Scenarios

分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-07

Junjie Zhang Zheming Zhang Huachen Xiang Yangquan Tan Linnan Huo Fengyi Wang

摘要： Physical function monitoring (PFM)plays a crucial role in healthcare especially for the elderly. Traditional assessment methods such as the Short Physical Performance Battery (SPPB) have failedto capture the full dynamic characteristics of physical function. Wearable sensors such as smart wristbands offer a promising solution to this issue. However, challenges exist, such as the computational complexity of machine learning methods and inadequate information capture. This paper proposes a multi-modal PFM framework based on an improved TimeMAE, which compresses time-series data into a low-dimensional latent space and integrates a self-enhanced attention module. This framework achieves effective monitoring of physical health, providing a solution for real-time and personalized assessment. The method is validated using the NHATS dataset, and the results demonstrate an accuracyof 70.6% and an AUC of 82.20%, surpassing other state-of-the-art time-series classification models.

同行评议状态:待评议

点击量 266 下载量 68 评论
5. ChinaXiv:202403.00340
下载全文

引导大语言模型生成计算机可解析内容

分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-07

王家晔

摘要：大语言模型 (Large Language Models, LLMs) 能够从大量语料的上下文中学习到模式，其包括词语之间的关系、句子的结构甚至更复杂的语义和语用信息。然而，让预训练语言模型生成结构化、严格遵循约定的内容仍然是一项挑战。本文提出了一种引导LLMs生成计算机高可用内容的方案，无需微调和额外的神经网络推理，通过提前约定的上下文无关文法 (Context-Free Grammar, CFG) 引入基于协程的内容生成约束机制，在自回归模型Transformer的解码阶段引导模型采样正确的词元，以构成符合程序约定的形式语言。这将有效地提升LLMs生成目标数据结构、类型或指令的稳定性和一致性，降低应用开发和集成的难度。本文作者先通过“匹配括号对”实验验证了GPT-2和Gemma等模型在生成DSL长度分别大于36和282时错误率就达到了95%，说明了当前LLMs在特定DSL生成上的性能问题。本文作者还提出了基于协程的DSL生成框架YieldLang，并使用LLMs在多个任务数据集上进行了实验，包括JSON、Mermaid流图和函数调用表达式生成等任务。这些实验表明本文的方法相比基准，其准确率提升到了原来的109%到1160%，并且在最好的情况下能够将LLMs生成JSON的采样次数降低到基准的约16.5%，这将有效地提高LLMs生成内容对计算机程序的可用性。

同行评议状态:待评议

点击量 504 下载量 113 评论
6. ChinaXiv:202404.00076
下载全文

Terrain Point Cloud Inpainting via Signal Decomposition

分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-05

Yizhou Xie Xiangning Xie Yuran Wang Yanci Zhang Zejun Lv

摘要： The rapid development of 3D acquisition technology has made it possible to obtain point clouds of real-world terrains. However, due to limitations in sensor acquisition technology or specific requirements, point clouds often contain defects such as holes with missing data. Inpainting algorithms are widely used to patch these holes. However, existing traditional inpainting algorithms rely on precise hole boundaries, which limits their ability to handle cases where the boundaries are not well-defined. On the other hand, learning-based completion methods often prioritize reconstructing the entire point cloud instead of solely focusing on hole filling. Based on the fact that real-world terrain exhibits both global smoothness and rich local detail, we propose a novel representation for terrain point clouds. This representation can help to repair the holes without clear boundaries. Specifically, it decomposes terrains into low-frequency and high-frequency components, which are represented by B-spline surfaces and relative height maps respectively. In this way, the terrain point cloud inpainting problem is transformed into a B-spline surface fitting and 2D image inpainting problem. By solving the two problems, the highly complex and irregular holes on the terrain point clouds can be well-filled, which not only satisfies the global terrain undulation but also exhibits rich geometric details. The experimental results also demonstrate the effectiveness of our method.

同行评议状态:待评议

点击量 299 下载量 71 评论
7. ChinaXiv:202404.00067
下载全文

基于 Python 中 MeCab 库对日语文章进行文本分析处理实现

分类：计算机科学 >> 计算机应用技术提交时间： 2024-04-04

于瑾麟

摘要：文本分析处理日益变成重要的课题之一，关于 jieba 中文分词的示例已有许多，但是关于日语语言分词的相关研究甚少，本文旨在介绍 Python 中 MeCab 库对日语进行分词的功能，并且给出相关案例代码，以便根据需要实现日语分词功能。

同行评议状态:待评议

点击量 419 下载量 132 评论
8. ChinaXiv:202403.00269
下载全文

基于大语言模型的中庸思维对心理健康的影响机制研究——道德中心性的中介作用

分类：心理学 >> 应用心理学分类：计算机科学 >> 计算机应用技术提交时间： 2024-03-23

吕思华朱廷劭

摘要：近年来，研究者们已较为一致地认识到中庸思维对心理健康的积极影响，然而其潜在的作用机制还不甚明晰。以往研究表明，当个体能较好地协调代表“利己”的能动动机和代表“利他”的共生动机时，就会拥有相对高的道德中心性水平。道德中心性体现了内部动机系统的平衡状况，其能降低内在动机之间的冲突，促使两种动机相互支持、相互激励。道德中心性或许在中庸思维对心理健康的影响中发挥了潜在中介作用。当前对于个体道德中心性的测量存在较为成熟的评估方法——Values Embedded in Narratives(VEIN)，但其涉及到对个人奋斗文本的价值观编码工作，因此测量过程较为复杂且人力成本较高。然而，近几年大型语言模型（比如ChatGPT）的发展显示出了其卓越的上下文理解能力，为心理学领域的文本分析和编码工作提供了新的可能性。本研究希望借助大型语言模型前沿技术，将其应用于心理学研究编码工作，降低个体道德中心性测量过程中所需要的时间以及人力成本，同时探究中庸思维对心理健康的影响机制，了解文化是如何通过影响道德中心性进而影响个体心理健康水平。研究一通过提示工程设计差异化提示词来训练GPT-3.5 Turbo识别个人奋斗中包含的价值观（成就/权力/博爱/仁爱），并对识别准确率、精确率和召回率进行评估，以得到符合要求、满足应用条件的识别模型。在研究二中将上述模型应用于道德中心性的测量中，验证道德中心性在中庸思维对心理健康（抑郁和焦虑）影响中的中介作用。研究结果如下：（1）GPT-3.5 Turbo大型语言模型在识别权力、成就、博爱和仁爱价值观的准确率不低于0.80，展现了ChatGPT在心理学研究中的应用潜力；（2）道德中心性在中庸思维对抑郁/焦虑的影响中起到了中介作用，高中庸思维的个体能更有效地整合能动与共生动机，增强其道德中心性，从而降低个体的抑郁/焦虑水平。综上所述，本研究利用大型语言模型技术突破了传统心理学研究技术上的限制，探究了中庸思维对心理健康的影响机制，验证了道德中心性在其中起到的中介作用。一方面证明了大型语言模型在心理学研究领域的应用潜力，另一方面也加深了我们对文化因素影响心理健康机制的认识，丰富了该领域的理论基础，启示了政策制定者，可以尝试发挥中庸文化优势，倡导重视个人发展同时注重集体福祉的价值观，帮助民众形成协调的思维模式，维护和促进人民精神健康与社会的良性发展。

同行评议状态:待评议

点击量 697 下载量 149 评论
9. ChinaXiv:202403.00268
下载全文

收入分配不平等对心理健康的影响机制研究——道德中心性的中介作用

分类：心理学 >> 应用心理学分类：计算机科学 >> 计算机应用技术提交时间： 2024-03-23

吕思华朱廷劭

摘要：近年来，研究者们已较为一致地认识到收入分配不平等对心理健康的影响，然而对于其内在的心理作用机制还不甚明晰。经济环境作为个体所处的宏环境，塑造着人们不同的价值观，使个体拥有不同水平的动机取向。以往研究表明，当个体能较好地协调代表“利己”的能动动机和代表“利他”的共生动机时，就会拥有相对高的道德中心性水平。道德中心性体现了内部动机系统的平衡状况，其能降低内在动机之间的冲突，促使两种动机相互支持、相互激励，帮助个体高效实现个人价值，通过寻找生活意义提高幸福感，进而减少产生心理健康问题的风险。因此，道德中心性或许在收入分配不平等对心理健康的影响中发挥了潜在中介作用。本研究希望探究收入分配不平等是如何通过影响道德中心性进而影响民众的心理健康水平，一方面丰富心理健康领域的理论基础，同时也为心理健康干预提供理论依据，有助于制定针对性的策略，以提升公众的心理福祉。借助社交媒体大数据以及自然语言处理技术，我们利用地区微博用户发布的帖子，通过心理语义词典提取代表群体道德中心性以及群体心理健康水平的词频特征，采用面板数据分析考察收入分配不平等如何通过道德中心性影响地区群体的负面情绪和自杀风险。研究结果证实了道德中心性在地区收入分配不平等对群体负性情绪/自杀风险的影响中起到了中介作用，收入分配不平等程度越高的地区往往伴随着越低的群体道德中心性水平，进而导致该地区群体的负性情绪/自杀风险增加。

同行评议状态:待评议

点击量 406 下载量 110 评论
10. ChinaXiv:202403.00300
下载全文

Application of Deep Learning Methods Combined with Physical Background in Wide Field of View Imaging Atmospheric Cherenkov Telescopes

分类：天文学 >> 天文仪器与技术分类：物理学 >> 核物理学分类：计算机科学 >> 计算机应用技术提交时间： 2024-03-10

Ao-Yan Cheng Hao Cai Tian-Lu Chen Yi-Qing Guo

摘要： The HADAR experiment, which will be constructed in Tibet, China, combines the wide-angle advantages of traditional EAS array detectors with the high sensitivity advantages of focused Cherenkov detectors. Its physics objective is to observe transient sources such as gamma-ray bursts and counterparts of gravitational waves. The aim of this study is to utilize the latest AI technology to enhance the sensitivity of the HADAR experiment. We have built training datasets and models with distinctive creativity by incorporating relevant physical theories for various applications. They are able to determine the kind, energy, and direction of incident particles after careful design. We have obtained a background identification accuracy of 98.6 %, a relative energy reconstruction error of 10.0 %, and an angular resolution of 0.22-degrees in a test dataset at 10 TeV. These findings demonstrate the enormous potential for enhancing the precision and dependability of detector data analysis in astrophysical research. Thanks to deep learning techniques, the HADAR experiment’s observational sensitivity to the Crab Nebula has surpassed that of MAGIC and H.E.S.S. at energies below 0.5 TeV and remains competitive with conventional narrow-field Cherenkov telescopes at higher energies. Additionally, our experiment offers a fresh approach to dealing with strongly connected scattered data.

通过

点击量 350 下载量 59 评论
11. ChinaXiv:202201.00007
下载全文

基于文本数据增强的生活满意度预测模型优化

分类：心理学 >> 应用心理学分类：计算机科学 >> 计算机应用技术提交时间： 2024-02-29

陈佳婧胡丁鼎宋蕊谭诗奇李雨晴张胜楠朱廷劭赵楠

摘要：目的随着网络大数据以及机器学习的方法的发展，越来越多研究结合文本分析与机器学习来预测满意度。在建立生活满意度预测模型的研究中，针对获取大量有效的有标注数据困难的问题，本研究提出基于文本数据增强以优化生活满意度预测模型。方法改编大连理工词典后，以357份生活现状描述为原始文本、生活满意度量表自评分为标注，经过EDA和回译进行文本数据增强，利用传统机器学习算法建立预测模型。结果结果显示，大连理工词典改编后，各模型预测能力大大提高；数据增强后，仅在线性回归模型上观察到回译和EDA的提升作用。使用原始数据进行训练的岭回归模型预测值与实际值的皮尔逊相关系数最高，达0.4131。结论特征提取精度的提升可优化目前的生活满意度预测模型，但对于以词频为特征建立的生活满意度预测模型，基于回译和EDA进行的文本数据增强可能并不十分适用。

同行评议状态:待评议

点击量 5954 下载量 433 评论
12. ChinaXiv:202401.00115
下载全文

不良光照条件对深度学习目标检测的影响研究

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-09

刘景硕

摘要：不良光照条件下的目标检测是一个重要的图像处理任务，目前的研究主要通过图像增强来减少图像噪声，同时改进网络结构和数据集来适应不良光照条件下的目标检测。然而，很少有人研究不良光照条件对目标检测的具体影响。因此在本文中，我们通过算法生成模拟不良光照条件的数据集，在不同的噪声条件下进行目标检测，统计检测结果，对影响进行研究。由于实验是在模拟数据中进行的，为了保证结果的准确性，我们利用实际场景的不良光照图像对结论进行了验证。

同行评议状态:待评议

点击量 506 下载量 120 评论
13. ChinaXiv:202401.00074
下载全文

Confident Association for Long-term Tracking

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-07

zhaohuizuo

摘要： Aiming at the exponential growth of solution scale in multiple hypothesis tracking (MHT), a continuous consistency model (CCM) is proposed. The key to improve MHT performance is to improve the effi#2;ciency of branch management. However, due to the inevitable detector failure, when the tree is expanded and each detection is organized as the root node of the new tree, a large number of virtual nodes are used. This leads to rapid growth of branches. Different from previous MHT implementations, CCM divides detection into four categories, in#2;cluding continuous, left continuous, right continuous and discontinuous. Comparative experiments show that CCM has significantly improved the computational efficiency and obtained the most advanced results on MOT challenge benchmark.

同行评议状态:待评议

点击量 503 下载量 75 评论
14. ChinaXiv:202401.00090
下载全文

特征级融合算法综述

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-07

韩龙坤

摘要：本文对特征级数据融合算法进行了分类概述，分布从基于概率统计的融合算法、基于逻辑推理的融合算法、基于特征抽取的融合算法、基于搜索的融合算法和基于神经网络的融合算法做了归纳，并且对数据融合的未来研究方向进行了总结论述。

同行评议状态:待评议

点击量 511 下载量 102 评论
15. ChinaXiv:202401.00091
下载全文

基于YOLO算法的标签识别检测

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-07

吕泽钰

摘要：本文运用YOLO视觉算法对标签进行识别检测，并对实验过程和实验结果进行了论述。

同行评议状态:待评议

点击量 656 下载量 141 评论
16. ChinaXiv:202401.00089
下载全文

SGT模型在磁信号异常检测中的应用及改进思路

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-06

胡苏杭

摘要：本报告探究了SGT模型在磁探领域的应用，特别关注了其在MGT、SNR0和SNR5数据集上的性能表现。实验结果揭示了SGT模型在处理这些数据集时存在虚警率过高和预测偏差较大等问题。为解决模型的预测能力和泛化能力不足的问题，我们设计了一系列改进实验，着重从调参、优化特征提取方式和修改连续性判断三个方面入手。在这三种改进方法中，调参取得了约0.5%的性能提升，特征提取优化和正交基判断的方法反而预测效果降低了20%。通过代码审查和逻辑推理，我们发现问题源于特征提取与模型不兼容。为适应正交基算法，我们提出一种改进思路：引入多种不同类型的特征，包括时域特征、频域特征和统计特征等，并综合利用这些特征信息，构建更为复杂而全面的SGT模型。此外，引入stacking模块，将基于不同特征的单一模型的预测结果作为输入，通过进一步的学习和综合，生成更准确的预测。

同行评议状态:待评议

点击量 356 下载量 76 评论
17. ChinaXiv:202401.00100
下载全文

一种基于目标检测的空间场景分类框架

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-06

吴若玲

摘要：长期以来，空间场景分类一直是地理信息科学领域的一个突出研究领域。在过去传统方法主要依赖于基于图像特征的检索方法。然而，随着深度学习和人工智能领域的迅速发展，对复杂空间场景的高效分类日益重要。本文提出了一种新颖的框架，该框架将目标检测与知识图谱相结合，自动完成空间场景分类。首先使用目标检测技术对输入图像进行处理以识别场景中的关键实体。随后，利用包含各种空间场景、实体及其关系的知识图谱来识别空间场景分类。为了验证该框架的有效性，我们使用八个空间场景类别进行了实验。实验结果表明，得到的分类结果与真实空间类型较为一致，验证了框架的有效性，展现了空间场景分类的潜在应用价值。

同行评议状态:待评议

点击量 395 下载量 92 评论
18. ChinaXiv:202401.00098
下载全文

探索扩散模型：从理论到应用的全面综述

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-06

刘怡然

摘要：扩散模型是一种强大的生成模型，能够在图像、文本和音频等多个领域内产生高质量的结果。本综述旨在汇总和分析应用于视觉领域的扩散生成模型的最新研究进展，包括该领域的理论和实践贡献。本文首先探讨了去噪扩散概率模型、基于分数的扩散生成模型和随机微分方程的扩散生成模型这三种主流模型的特点和原理，并分析了旨在优化模型内部算法和提高采样效率的相关衍生模型。其次，综合评述了扩散模型在当前的应用情况，包括在计算机视觉、自然语言处理、时间序列分析、多模态研究以及跨学科等多个领域的实际应用。最后，基于当前的研究趋势和挑战，对扩散模型未来的发展方向进行了展望，以期为该领域的研究提供指导和启发。本文旨在为研究人员提供一个关于扩散模型研究和应用的全面视图，强调其在人工智能生成内容（AIGC）领域的重要地位和未来潜力。

同行评议状态:待评议

点击量 406 下载量 998 评论
19. ChinaXiv:202401.00094
下载全文

基于动态增强MR图像的垂体微腺瘤智能检测方法

分类：计算机科学 >> 计算机应用技术分类：医学、药学 >> 临床医学提交时间： 2024-01-06

高旌源

摘要：垂体微腺瘤通常难以通过平扫核磁共振成像的方式来检测，且误诊的风险较高、病例较少，这使得垂体微腺瘤的检测分割与分类诊断工作难度较大。基于上述问题，本文提出了一种基于动态增强序列的计算机辅助诊断系统DCEPM-CAD。在提取动态增强MR序列时序信息的同时对其中主干网络HRNetv2添加注意力模块进行改进。为了避免因垂体微腺瘤在图像中占据像素过少而无法提取其相关特征的问题，本文还引入TecoGAN图像超分辨率方法来对垂体区域图像进行超分辨率重建。在275名符合研究条件者的共862张MR图像数据集中，DCEPM-CAD针对垂体微腺瘤的诊断准确率达到77%，同时在垂体、垂体微腺瘤的分割方面取得了显著的效果，Dice相似性系数分别达到92.16和72.54。

同行评议状态:待评议

点击量 341 下载量 97 评论
20. ChinaXiv:202401.00106
下载全文

Overview of deep learning theory and its application

分类：计算机科学 >> 计算机应用技术提交时间： 2024-01-06

Xiaoning Liu

摘要： Deep Learning is a new research direction in the field of machine learning, which is introduced into machine learning to make it closer to the original goal -AI(Artificial Intelligence).Deep learning is the inherent law and level of learning sample data. The information obtained in these learning processes is very helpful for the interpretation of data such as text, images, and sounds. Its ultimate goal is to allow machines to analyze learning ability like humans and can recognize data such as text, images and sounds. It is a complex machine learning algorithm, which has achieved the effect in terms of voice and image recognition, far exceeding the previous related technologies, especially in searching technology, data mining, machine translation, natural language processing, multimedia learning, voice, recommendation and personalized technologies, and other related fields. This article discusses the theoretical knowledge of deep learning and investigates the application of the algorithm in various fields, to provide a certain reference for deep learning studies.

同行评议状态:待评议

点击量 527 下载量 134 评论

1 2 3 4 5 6 7 8 后页尾页