Loading [MathJax]/extensions/TeX/noErrors.js
按提交时间
按主题分类
按作者
按机构
  • DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation

    分类: 计算机科学 >> 自然语言理解与机器翻译 分类: 计算机科学 >> 计算机软件 分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-05-20

    摘要: Domain-specific QA systems require not just generative fluency but high factual accuracy grounded in structured expert knowledge. While recent Retrieval-Augmented Generation (RAG) frameworks improve context recall, they struggle with integrating heterogeneous data and maintaining reasoning consistency. To address these challenges, we propose DO-RAG, a scalable and customizable hybrid QA framework that integrates multi-level knowledge graph construction with semantic vector retrieval. Our system employs a novel agentic chain-of-thought architecture to extract structured relationships from unstructured, multimodal documents, constructing dynamic knowledge graphs that enhance retrieval precision. At query time, DO-RAG fuses graph and vector retrieval results to generate context-aware responses, followed by hallucination mitigation via grounded refinement. Experimental evaluations in the database and electrical domains show near-perfect recall and over 94% answer relevancy, with DO-RAG outperforming baseline frameworks by up to 33.38%. By combining traceability, adaptability, and performance efficiency, DO-RAG offers a reliable foundation for multi-domain, high-precision QA at scale.

  • 目的论驱动的情感计算:以对齐福祉为目标的因果框架

    分类: 计算机科学 >> 计算机应用技术 分类: 心理学 >> 应用心理学 提交时间: 2025-05-01

    摘要: 本文基于目的论视角,对当代情感理论与情感计算的主要成果与不足之处进行系统梳理与反思,并提出了“目的论驱动的情感计算"这一新框架。首先,本文从进化功能性的角度重新审视基本情绪、评价理论及建构主义等主流学说,指出情感的核心在于帮助生命体适应环境、实现目标。现有情感计算研究虽在多模态情感识别以及评价理论驱动的情感生成等方面取得显著进展,但多停留于对外在特征的模式识别,尚缺乏应对个体及群体层面的情感动态与多层次需求的系统应答框架。为此,本文主张以对齐个体与群体福社为核心目标,并在算法层面通过两大关键环节来实现:第一,基于真实个体的情感事件数据进行因果建模,生成能准确模拟个体情感和行为动力学的虚拟环境;第二,利用元强化学习在此环境中开展持续训练,使情感智能体在不同情境下学会平衡短期与长期需求并快速适应个性化关切。具体做法包括构建大规模"个人情感事件数据宇宙”(personal affective event dataverse)来支撑因果结构学习,并在训练阶段通过合理的奖励函数设计,将“帮助用户获得持续且更广泛的积极体验”内化为智能体的主要目标,并兼顾不同情感需求在时空维度和群体尺度上的平衡。本文同时提醒,如何在多元需求与社会公平之间达成协调仍是待解决的关键挑战,需要进一步结合心理学与社会学理论加以应对。总体而言,目的论导向的情感计算框架为智能体基于个体和群体的情感认知与深度共情奠定了基础,展示出推动人机交互与社会福社融合发展的潜在价值。

  • 面向社会媒体数据的心理分析:林萃分析系统

    分类: 心理学 >> 应用心理学 分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-04-19

    摘要: 随着技术的发展,大数据时代悄然到来。大数据的出现为科研带来了极大的便利,使得科研工作者可以通过大规模数据的分析,提高科研工作的效率。本文介绍了我们开发实现的林萃分析系统,帮助编程基础少或无的科研人员使用既有的python程序完成数据的采集和分析,零编程基础也可以操作。林萃分析系统参照了常规研究的数据采集处理的流程,首先从采集的数据中过滤出符合要求的数据,形成数据组,这个过滤的过程可以是多步骤的。然后,将过滤后的数据切分为个体数据,在对个体数据进行计算处理,得到用户的各项心理语义或心理指标。用户可以使用爬虫或者自行采集的数据,通过对数据进行过滤和切分,得到个体行为数据,这里个体不仅仅指每个用户,而是指一个地区或个体在指定时间段内的数据。在这些数据基础上,可以利用词典进行心理语义分析(词频统计)以及心理指标预测。在这些计算结果的基础上,可以根据研究的需求进行截面分析或者面板数据分析等。本文通过一个具体的案例演示了如何利用林萃分析系统实现数据分析的全过程,表明林萃分析系统可以在数据的获取和分析方面为科研提供帮助。

  • The Thermal Contact Resistance Dataset and the Artificial Intelligence-Driven Prediction of Thermal Contact Resistance in Multi-material Systems

    分类: 动力与电气工程 >> 工程热物理学 分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-04-11

    摘要: In the current era of artificial intelligence, the advancement of high-performance computing based on electronic devices is hindered by thermal contact resistance. To accurately predict this resistance, we established a comprehensive database derived from extensive experimental work documented in previous studies. By employing machine learning algorithms, we developed a prediction model for thermal contact resistance that utilizes this dataset. This model can predict the thermal contact resistance among all learned materials, demonstrating a significant degree of general applicability. Our model shows strong performance on the test set (with a coefficient of determination of 0.982) , reflecting a high level of predictive accuracy. Additionally, the interpretability analyses conducted on the machine learning model are consistent with established theories of thermal contact resistance, further confirming the model’s accuracy. We anticipate that this database will support the development of thermal contact resistance prediction models and that our model will enhance the precision of thermal contact resistance predictions.

  • AD-Det: Boosting Object Detection in UAV Images with Focused Small Objects and Balanced Tail Classes

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-04-06

    摘要: Object detection in Unmanned Aerial Vehicle (UAV) images poses significant challenges due to complex scale variations and class imbalance among objects.Existing methods often address these challenges separately, overlooking the intricate nature of UAV images and the potential synergy between them. In response, this paper proposes AD-Det, a novel framework employing a coherent coarse-to-fine strategy that seamlessly integrates two pivotal components: Adaptive Small Object Enhancement (ASOE) and Dynamic Class-balanced Copy-paste (DCC).ASOE utilizes a high-resolution feature map to identify and cluster regions containing small objects. These regions are subsequently enlarged and processed by a fine-grained detector. On the other hand, DCC conducts object-level resampling by dynamically pasting tail classes around the cluster centers obtained by ASOE, maintaining a dynamic memory bank for each tail class. This approach enables AD-Det to not only extract regions with small objects for precise detection but also dynamically perform reasonable resampling for tail-class objects. Consequently, AD-Det enhances the overall detection performance by addressing the challenges of scale variations and class imbalance in UAV images through a synergistic and adaptive framework.We extensively evaluate our approach on two public datasets, i.e., VisDrone and UAVDT, and demonstrate that AD-Det significantly outperforms existing competitive alternatives.Notably, AD-Det achieves a 37.5% Average Precision (AP) on the VisDrone dataset, surpassing its counterparts by at least 3.1%.

  • 神经模拟推断:基于神经网络和模拟推断的认知建模方法

    分类: 心理学 >> 认知心理学 分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-04-03

    摘要: 认知建模是量化和理解人类心智过程的重要方法,但目前该方法多集中于简单实验任务和数据结构,当试图构建复杂模型以解释复杂认知过程时,能否确定其似然并完成参数推断成为一项严峻的挑战。基于神经网络的模拟推断方法结合了模拟推断与分摊技术,无需计算似然函数,直接利用模拟数据来参数推断,并通过神经网络训练控制计算成本,可快速稳健地进行参数推断。该方法已成功应用于证据积累模型框架下的大规模数据、动态潜变量以及联合建模等场景,并开始扩展到强化学习和贝叶斯决策模型。未来的研究可以进一步验证神经模拟推断的有效性,应用该方法扩大认知模型的应用范围,推动理论与模型发展,增进对人类复杂认知加工规律的理解。

  • Utilizing Large Language Models to Analyze PSR.exe Recorded Input for Computer Use

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-03-21

    摘要: 大型语言模型 (LLM) 的快速发展为复杂工作流程的自动化开辟了新领域。本文探讨了一种利用大型语言模型 (LLM) 解析和解释 PSR.exe(一种用于捕获用户鼠标和键盘操作的工具)记录的数据来模拟计算机使用的创新方法。我们提出了一种提取、分析和复制 MHT 文件中记录的用户交互的方法。通过解码屏幕截图和提取动作序列,我们旨在开发一个自动化流程,使应用程序能够有效地模拟用户操作。该工作流结合了 BeautifulSoup(用于 XML 解析)、base64(用于图像解码)和 LLM(用于语义分析)。结果表明,我们的方法轻量级、多功能,能够确保精度和适应性,同时减少对外部跟踪工具的依赖。

  • 基于大语言模型的自杀意念文本数据增强与识别技术研究

    分类: 心理学 >> 应用心理学 分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-03-19

    摘要: 自杀已成为全球性公共卫生难题,传统的自杀意念识别方法主要依赖患者主动求助,而基于文本分析的自动识别模型则受限于标注数据的稀缺性。本研究创新性地提出一种基于大语言模型的数据增强方法,旨在提升自杀意念文本识别的精度。研究采用双阶段设计:研究一聚焦于数据增强,研究二验证增强效果。在研究一中,选用ChatGLM3-6B和Qwen-7B-Chat作为底层模型,结合有监督学习策略与零样本和少样本学习方法,优化训练数据集质量。通过8组严谨的对比实验,结果显示两类自研模型在数据增强方面表现卓越,其处理后数据集的综合得分分别达到0.90和0.92,显著优于基线模型(p<0.001)。研究二进一步评估了数据增强对识别模型性能的影响,结果表明,增强后的模型在识别准确率和正确拒绝率指标上全面超越最佳基线模型(p<0.001)。本研究不仅验证了基于大语言模型的数据增强方法在提升自杀意念识别模型性能方面的有效性,还为心理健康领域的人工智能应用开辟了新方向。这种方法有望在保护用户隐私的同时,提供及时、有效的自杀风险早期预警,为自杀预防工作提供重要的技术支持和研究思路。未来研究可着眼于扩大数据异质性、优化提示工程设计、引入人机交互范式等,进一步拓展该方法在促进临床心理诊断领域的应用。

  • 基于深度卷积神经网络的大学英语四级考试成绩早期预警

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-03-12

    摘要: 大学英语四级考试成绩早期预警模型易受学生日常行为模式差异干扰,影响预测精度。以某智慧教学平台上与大学英语四级考试直接相关的四级题型模块化学习成绩作为数据来源,建立模块化学习灰度图片数据库,同时将深度学习引入早期预警,形成基于深度卷积神经网络的大学英语四级成绩预警模型,对学生是否能在大学英语四级考试中取得预期成绩进行前期预测。验证结果表明,深度卷积神经网络预测模型相较于现有的预测模型具有更高的预测精度,可得到更早的最佳干预时间,有利于教师更好地对风险学生进行干预,提高学生大学英语四级考试成绩,提升英语语言应用能力。

  • “躺平”对心理健康和幸福感的影响研究——基于2010-2021年微博面板数据分析

    分类: 心理学 >> 应用心理学 分类: 计算机科学 >> 计算机应用技术 提交时间: 2025-01-11

    摘要: 随着“躺平”现象在社会中的广泛传播,其对个体心理健康和幸福感的影响成为重要研究课题。本研究采用词典分析与面板数据建模方法,基于2010-2021年中国31个省/市/自治区的新浪微博数据,构建躺平词典并量化分析躺平程度,进而探讨其对自杀风险、生活满意度及心理幸福感的影响。结果显示,2010-2021年中国31个省/市/自治区的躺平程度总体呈上升趋势,且对生活满意度、心理幸福感有负向预测作用,对自杀风险多个子维度有正向预测作用。这表明躺平并非积极应对方式,它会削弱个体生活满意度与心理幸福感,增加自杀风险。本研究为理解躺平现象及其心理影响提供了新视角和实证证据,有助于相关部门和社会各界及时了解并应对“躺平”现象可能带来的社会影响。

  • 细粒度情感态度词典构建与效度验证

    分类: 心理学 >> 应用心理学 分类: 计算机科学 >> 计算机应用技术 分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-12-17

    摘要: 对于政府和企业而言,面对频繁发生且影响广泛的信息事件,传统的正负情感二元识别已无法满足现实需求,需要更加精确和深入的分析工具。为解决现有情感词典粒度较粗和关键词覆盖率低的问题,本文基于认知-评价理论,扩充评价类情绪,并爬取社交媒体中的热点事件,形成语料库,在现有词典的基础上由专家进行筛选与归类,最终形成包含50种情感类别的细粒度情感态度词典。然后结合人工评估与事件分析方法对词典在识别中的准确性与有效性进行检验。首先,以人工分类为参考标准,词典的情感类别准确率均值达到88%,能够准确识别精细情感。其次,使用词典对“海天酱油双标事件”与“成都女童被咬事件”进行文本分析后发现,大类情感识别结果与民众整体倾向相吻合,还观察到了细分情感在时序变化上的异质性,为细粒度情感分析在应对和理解复杂舆论环境中的有效性提供了支持。

  • 全自动生活:人工智能与机械结合的未来

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-11-27

    摘要: 全自动生活的愿景是将人工智能(AI)与机械系统相结合,以实现对日常任务的全方位自动化。本文详细探讨了实现这一愿景的必要性、带来的好处和影响,并深入分析了加速实现这一愿景所需关注的技术栈和发展路线。通过对现有技术和未来趋势的分析,我们提出了一套可行的发展路径,为实现全自动生活提供了理论依据和实践指导。

  • 基于知识图谱推理驱动的多模态早期中立评估智能体研究

    分类: 法学 >> 数据法学 分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-11-26

    摘要: 早期中立评估是落实“诉源治理”理念、实现纠纷高效化解的重要机制,但当前面临专业人才匮乏和普及度受限等挑战。大模型技术的发展为破解困境提供了新的可能性,然而其法律逻辑推理能力的不足仍限制了在早期中立评估等法律咨询任务中的应用。本研究一是优化了LightRAG知识图谱检索增强技术,提升其可视化法律推理能力和多轮对话记忆功能,使其更适配多轮法律咨询场景,并引入微调后的ChatGLM3-6B模型作为问答引擎,同时结合多模态大模型Lama-3.2-vision和SenseVoice-small分别负责图像与音频处理。二是在《民法典》及其适用解释以及国际仲裁云链线上法律文书数据集的基础上,构建法律知识图谱,并通过数据清洗与提示词工程优化,完成了智能体的集成开发,实现了从多轮法律咨询到证据提交再到早期中立评估文书生成的全流程智能化支持。实验结果表明,与通义千问-Max、通义千问-Turbo、ChatGLM3-6B和通义法睿-Plus-32k模型相比,本研究构建的智能体在响应速度和问答质量方面均表现出显著优势。此外,采用模型推理与数据分离范式,确保用户数据仅在本地存储,推理过程加密传输且服务器不存储数据,从而显著提升了个人信息安全性,可为早期中立评估的智能化应用提供有力的技术支撑。

  • 基于图条件函数依赖发现的数据一致性修复算法

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-11-25

    摘要: 以知识图谱为代表的图数据集中不可避免地会出现不完整性,冲突等数据质量问题。而数据一致性往往用以判断数据集合中的不一致或冲突,其指数据(语义)的正确性,是反映数据质量的重要指标之一。针对以数据一致性为代表的图数据的数据质量问题,基于图函数依赖(GraphFunctionalDependency,GFD)提出了图条件函数依赖(GraphConditional Functional Dependency,GCFD),并通过挖掘算法GCFDMiner(GraphConditionalFunctionalDependencyMiner)和图数据一致性修复算法GRepair提升了图数据的数据质量。GCFDMiner先利用频繁图挖掘算法从原图中挖掘出频繁图模式并得到同构子图,再将子图中节点与图模式相对位置进行一一映射,得到从图数据转化为关系数据的节点-属性表,最后利用关系依赖挖掘算法从表中挖掘图条件函数依赖集合。为测试图条件函数依赖的数据修复能力,通过GRepair迭代“匹配-修复"步骤直至成功修复不一致错误,并减弱图条件函数依赖冲突的影响提升修复效果。最后,在真实数据集和合成数据集上验证了GCFDMiner和GRepair的效果和效率优势。

  • Animating the Past: Reconstruct Trilobite via Video Generation

    分类: 生物学 >> 生物学其他学科 分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-11-12

    摘要: Paleontology, the study of past life, fundamentally relies on fossils to reconstruct ancient ecosystems and understand evolutionary dynamics. Trilobites, as an important group of extinct marine arthropods, offer valuable insights into Paleozoic environments through their well-preserved fossil records. Reconstructing trilobite behaviour from static fossils will set new standards for dynamic reconstructions in scientific research and education. Despite the potential, current computational methods for this purpose like text-to-video (T2V) face significant challenges, such as maintaining visual realism and consistency, which hinder their application in science contexts. To overcome these obstacles, we introduce an automatic T2V prompt learning method. Within this framework, prompts for a fine-tuned video generation model are generated by a large language model, which is trained using rewards that quantify the visual realism and smoothness of the generated video. The fine-tuning of the video generation model, along with the reward calculations make use of a collected dataset of 9,088 Eoredlichia intermedia fossil images, which provides a common representative of visual details of all class of trilobites. Qualitative and quantitative experiments show that our method can generate trilobite videos with significantly higher visual realism compared to powerful baselines, promising to boost both scientific understanding and public engagement.

  • 无人机与人工智能技术在甘蔗高度估测中的应用

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-09-27

    摘要: [目的] 提出并验证一种结合人工智能与无人机技术的甘蔗高度估测方法。[方法] 利用无人机拍摄甘蔗田的图像,创建二维地图,结合AI算法识别甘蔗轮廓并通过数学模型计算甘蔗高度。系统还通过无人机机场和边缘计算设备实现自动化操作。[结果] 实验表明,该系统在不同环境条件下具有较高的测量准确性,平均误差小于5%,且与传统方法相比,效率显著提高。[局限] 极端天气条件下系统性能可能受限,且实时数据处理对计算资源需求较高。[结论] 该系统为精准农业提供了强大的工具,能够在大规模农业中应用并显著提升作物管理效率。

  • FAR:基于静态中心标注与增强子图评估的新型快速API推荐算法

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-08-24

    摘要: 随着数字化浪潮的推进,Mashup 技术通过融合异质 Web API,为开发者提供了创造独特增值服务的可能。然而,Web API 数量的激增使得开发者在构建 Mashup 应用时面临 API 兼容性及业务逻辑协同的挑战,API 的适配搜索变得耗时且困难。针对这些问题,本文提出了一种创新的 Mashup 组合推荐算法 FAR(Fast API Recommendation),该算法基于静态中心标注法,通过构建高效的离线索引结构和独特的子图评价机制,显著提升了推荐系统的准确率。同时,FAR 算法采用柱状搜索策略,优化了子图生成速度,并避免了过分强调 API 兼容性而忽略实用性的问题,从而提高了推荐效率。此外,本文还提出了根节点优化策略与子图权重优化策略,为 Mashup 推荐领域的研究提供了有益启示。在针对 mashup 数据集的详细实验评估中,FAR 算法在平均运行时间、推荐节点数、精确度(MP)、召回率(MR)以及归一化折扣累积增益(NDCG)等方面均优于当前主流的 API 推荐与图搜索算法,显示出更高的实用性和性能优越性。

  • 基于机器学习预测员工流动率研究

    分类: 计算机科学 >> 计算机应用技术 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-08-19

    摘要: 本文研究了基于机器学习算法预测企业员工流动率的问题,旨在通过数据分析帮助企业减少人才流失,降低运营成本。随着知识经济时代的到来,员工流动已成为影响企业发展的重要因素。高离职率不仅增加了企业的招聘和培训成本,还可能导致技术资源外流和客户流失,严重影响企业的竞争力和盈利能力。本文首先介绍了员工流动对企业造成的多方面负面影响,包括财务成本增加、业务进度受阻、团队士气下降等。随后,阐述了在人工智能和大数据背景下,利用机器学习技术进行员工离职预测的必要性和可行性。通过回顾相关文献,本文选择了朴素贝叶斯、K-最近邻(KNN)和随机森林三种机器学习算法,构建员工离职预测模型。在数据预处理阶段,使用来自Kaggle网站的员工离职数据集,该数据集包含1470条记录,涉及员工的基本信息、职位信息、薪酬福利及工作满意度等多个维度。通过数据清洗和特征选择,去除了无关变量和多重共线性较高的变量,保留了影响员工离职的关键因素。在模型构建和评估阶段,本文分别建立了朴素贝叶斯、KNN和随机森林三种预测模型,并进行了适用性分析和参数优化。通过比较各模型的预测性能,本文最终选择了随机森林模型作为最优预测模型,该模型在准确率、召回率和F1分数等指标上均表现出色。基于最优预测模型的结果,本文进一步分析了影响员工离职的关键因素,包括薪酬福利、工作满意度、晋升机会等。针对这些因素,本文提出了相应的员工储备和管理建议,如提高薪酬福利水平、改善工作环境、加强员工职业发展等,以帮助企业降低员工离职率,提高团队稳定性。最后,本文总结了研究的主要发现和贡献,指出了研究的局限性和未来研究方向。本文的研究不仅为企业提供了有效的员工离职预测工具,还为人力资源管理领域的研究提供了新的思路和方法。

  • 基于Stacking集成学习模型在学生学业预测分类中的应用

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-08-06

    摘要: 针对学生学业预警二分类问题,本文提出一种基于 Stacking 的集成学习模型。模型结合了学生的家庭背景、在校表现和环境因素。本文通过使用BernoulliNB、HistGradientBoost 构建基学习器,Logistics 回归作为元学习器集成分类,并与其他基准模型进行比较。实验结果表明,模型的准确率达到 93.9%,分别高于 K临近算法,决策树模型,随机森林和lightgbm 模型7.99%,6.61%,2.20%,2.47%;且 F1分数达到 0.95,表明模型在学生学业预测上有较高应用价值。

  • Segment Anything for Videos: A Systematic Survey

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-08-05

    摘要: The recent wave of foundation models has witnessed tremendous success in computer vision (CV) and beyond, with the segment anything model (SAM) having sparked a passion for exploring task-agnostic visual foundation models. Empowered by its remarkable zero-shot generalization, SAM is currently challenging numerous traditional paradigms in CV, delivering extraordinary performance not only in various image segmentation and multi-modal segmentation (e.g., text-to-mask) tasks, but also in the video domain. Additionally, the latest released SAM 2 is once again sparking research enthusiasm in the realm of promptable visual segmentation for both images and videos. However, existing surveys mainly focus on SAM in various image processing tasks, a comprehensive and in-depth review in the video domain is notably absent. To address this gap, this work conducts a systematic review on SAM for videos in the era of foundation models. As the first to review the progress of SAM for videos, this work focuses on its applications to various tasks by discussing its recent advances, and innovation opportunities of developing foundation models on broad applications. We begin with a brief introduction to the background of SAM and video-related research domains. Subsequently, we present a systematic taxonomy that categorizes existing methods into three key areas: video understanding, video generation, and video editing, analyzing and summarizing their advantages and limitations. Furthermore, comparative results of SAM-based and current state-of-the-art methods on representative benchmarks, as well as insightful analysis are offered. Finally, we discuss the challenges faced by current research and envision several future research directions in the field of SAM for video and beyond.