分类: 计算机科学 >> 计算机科学技术其他学科 分类: 生物学 >> 分子生物学 分类: 数学 >> 逻辑 提交时间: 2024-07-01
摘要: Polymer aggregates and molecular polymers are written as computable numbers, resulting in a unity between cells and universal Turing machines with the Entscheidungsproblem. However, whether the Entscheidungsproblem of cells really exists remains elusive. Alan Turing found universal Turing machines read only computable numbers written by humans who further differentiate transcendental numbers from the set of computable numbers by Georg Cantor’s diagonal process. It follows that the decidability of the Entscheidungsproblem derived from humans eliminates the independence of computable numbers from each other and enables computable numbers to be fused with each other into the set of computable numbers, with the result that humans are endowed with a capacity to read of the fusion of computable numbers with each other into the set of computable numbers by humans to read the set of computable numbers bearing computable numbers by being endowed with a capacity to write computable numbers. Accordingly, it is shown here how humans are invited to write cell backbones as complex numbers read by artificial intelligence machines emulated by cells by writing polyribonucleotides as computable numbers read by universal Turing machines emulated by extracellular ribosomes to extend Georg Cantor’s continuum hypothesis by being invited to extend Alan Turing’s work on the Entscheidungsproblem, resulting in a unity between cells and artificial intelligence machines without the Entscheidungsproblem.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-06-28 合作期刊: 《中国科学院院刊》
摘要: 人工智能是当前科技界最受关注的领域之一,而中国和美国是全球最重要的两个人工智能研究和开发 中心。然而,中美两国在这个领域的发展存在明显差异。尤其是2022 年ChatGPT的问世,引发了对中国人工 智能企业能力和竞争力的广泛讨论。文章通过对中美两国过去5 年获批的超过12 万件人工智能发明专利的分 析,首先构建了一个基于专利特征的多维度指标,并基于该指标定义了中美两国人工智能领域的前十大企 业。进一步的分析显示,这2 组企业在专利技术和研究网络上存在显著差异。中国人工智能头部企业的专利 数量相对较少,引用率和转化率也较低。中国头部企业的专利主要集中在图像识别、语音识别等应用层技术 上,并且尚未形成独具特色的技术集群。与此相对,美国人工智能头部企业产出了更多具有高影响力的专 利,并在人工智能产业的基础层和技术层形成了多个技术集群。就学术研究而言,中国人工智能头部企业主 要与国内的研究机构进行合作,而美国头部企业则表现出更强的中美合作及美国本土企业间的合作。文章的 比较分析揭示了中美两国人工智能头部企业在技术能力和合作策略上的差异,并为中国更好地发展人工智能 产业提供了企业管理启示和3 条政策建议。
分类: 物理学 >> 普通物理:统计和量子力学,量子信息等 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-05-14
摘要: In his 1950 paper 11 , Turing proposed the notion of a thinking machine, namely a machine that can think. But a thinking machine has to follow a certain law of physics, provided it is realized physically. In this paper, we show that Turing’s thinking machine necessrily obeys ’t Hooft’s principle of superposition of states, which was presented by ’t Hooft 8 in 2016 beyond the usual one as described by Dirac 4 in the conventional quantum mechanics. Precisely, Turing’s thinking machine must be a quantum machine, while ’t Hooft’s principle characterizes its thinking behavior in a probabilistic way.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-05-09
摘要: 为响应学术界和工业界对于科学的恶意代码分类方法的需求,本研究基于现有工作基础,借鉴了卡巴斯基相对严谨的多段式分类命名的优点,按照强调互斥、完整覆盖、收敛的思路开展,并与“威胁风险行为标签”组合运用,形成了一套符合MECE原则、分类收敛、兼容工业界事实分类的恶意代码分类框架,能够有效支撑安全防御与治理。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-04-24
摘要: In capital market, earlier detection of the influential entities can be beneficial to both market investors’ and regulators’ decision making, those whose change can significantly affect the whole trend of the related ones. Meanwhile, market manipulation in capital markets is a serious concern, encompassing tactics like pump and dump, market cornering, spoofing, and wash trading, which disrupt market fairness and erode investor trust. Market manipulation encompasses a range of activities designed to artificially influence the price or trading volume. By leveraging both information behavior data(stock news opinion/volume) and business behavior(stock trading price/volume), together with trade patterns and communication channels, several herding based manipulation scenes and detection models are discussed and proposed.
分类: 信息科学与系统科学 >> 信息科学与系统科学基础学科 分类: 计算机科学 >> 计算机科学技术其他学科 分类: 工程与技术科学 >> 工程数学 提交时间: 2024-03-30
摘要: 什么是智能?是人工智能的核心问题之一,但是至今没有一个公认的定义。本文从智能与生命的关系视角提出:智能是生物体的基本能力和特征属性,是一种尽量用最小能量实现最大信息量,通过信息处理来适应环境、维持存在的能力。在此基础上,提出了智能是物质能量与信息之间的相互转换能力这一新观点,进一步提出了智能的测度计算方法、平均智能、综合智能等新概念,最后讨论了物质、能量与信息的定量转换关系,指出了智能的上界和能量转换为信息的下界,为便于实际应用,进一步给出一个无量纲的智能测度计算公式。为智能系统定量分析智能的高低给出了可行的计算方法。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-02-20
摘要: 本文分析了目前LLM存在的主要问题,并提出了具体解决方法,指出了:结合概率的概念化结构模型的表达和计算是关键,并对相关技术—深度语义模型(DSM)进行了简要的讲解,最后列举了后续的重点工作方向。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-10
摘要: 随着科学技术的发展,脑电信号因为蕴含丰富的生理、心理和病理内容,而被运用与越来越多的领域。经过在脑电信号的数据集上的相关实验表明,本项目实现的基于LSTM模型对阿尔兹海默症的判别取得了较好的结果,平均准确率为93%左右。
分类: 统计学 >> 数理统计学 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-08
摘要: No Free Lunch(NFL)定理是统计学习理论的一个重要结果,依据贝叶斯建模可以推得损失/效用函数的期望与预测函数的假设空间的选取有关。若认为真实的预测函数空间是不可知的,则任意选择的假设函数空间都不一定得到最优的损失函数的期望。本文对NFL定理的极限情况进行分析,利用分布的一致收敛性,即Glivenko-Cantelli定理的一种局部形式得到在一定情况下的确定性与非确定性预测问题中,当样本量趋于无穷大损失/效用函数的期望与假设函数空间的具体选择无关。此项工作的一个副产物是利用本文得出的分布的一致收敛性的局部形式可以推得分布的总变差(total variation)一致收敛性。此前该性质一般是认为不存在的。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-08
摘要: 随着传感器和网络技术的飞速发展,大量历史时间序列数据出现,高效准确地进行时间序列预测越来越重要。近年来,将深度学习的思想和技术运用到时间序列预测任务中的方法发展迅速,并取得了许多成果。本文分析了时间序列预测方法的国内外研究现状,论述了时间序列预测所涉及的相关理论,归纳总结了该任务所运用的传统方法、基于机器学习的方法和基于深度学习的方法,重点对比分析了基于深度学习的各方法的优缺点,并由此对基于深度学习的时间序列预测方法进行了展望。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-07
摘要: 图像分类和识别在现代社会中具有重要意义。已经有许多优秀的卷积神经网络工作来优化图像分类的准确性,其中一位杰出的代表是ResNet 1 ,它大幅增加了神经网络的深度,从而极大地提高了神经网络的性能。与此同时,还有一些可插拔的性能优化子模块可以帮助优化所有网络,其中一个杰出的代表是SeNet 3 。然而,在面对现实世界中的复杂场景时,它们并不总是表现良好。本文的主要工作是研究如何有效提高卷积神经网络(ResNet)在一些特殊场景(小图片、高噪声图片)中的识别性能,并尝试分析一些神经网络的底层机制。
分类: 环境科学技术及资源科学技术 >> 环境学 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-07
摘要: 目的 本研究的目标是开发一种便携式气相色谱仪,结合机器学习实现现场的VOC采集和快速的气味评价。 方法 我们使用卷积神经网络-长短期记忆(CNN-LSTM)建立了气味强度的预测模型。由于收集的数据量较小,我们使用生成对抗网络(GAN)对每个气味强度类别的VOC数据进行了生成,以增强模型的训练。 结果 在生成数据后,我们再次使用CNN-LSTM建立了模型,并与人工神经网络(ANN)、支持向量机(SVM)和梯度提升决策树(XG-Boost)进行了比较。结果表明,使用GAN生成数据后的测试准确率优于原始数据。 局限 未来的工作将集中在进一步优化模型和扩大数据集上,以提高预测的准确性和稳定性。 结论 这项研究表明,通过使用深度学习和生成对抗网络,我们可以有效地预测车内的气味强度,从而改善车内的空气质量。此外,我们还将探索将这种方法应用于其他环境条件下的空气质量预测。这为未来的空气质量监测和改善提供了新的可能性。由于我们的设备是便携式的,且模型结构较小可以直接嵌入到设备上,从而实现现场的VOC采集和快速的气味评价。这为未来的空气质量监测和改善提供了新的可能性。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-06
摘要: 随着深度学习技术的蓬勃发展,其在图像分类领域的广泛应用为计算机视觉领域带来了革命性的变化。本文聚焦于深度学习在图像分类中的应用,以CIFAR-10数据集为基础,通过卷积神经网络(CNN)构建不同模型,对图像进行了分类精度评估。我还采用了ResNet等著名模型,对它们在CIFAR-10数据集上的分类性能进行了评估。为深入研究模型的特性,我们在实验中引入了不同的激活函数,并通过对比它们在分类任务中的表现,揭示了激活函数对模型性能的影响。此外,通过调整训练轮次等超参数,我们系统地研究了模型在不同训练轮次下的分类准确度。在实验中,我发现了训练的轮次并不是越多越好,可能会出现过拟合的现象,但是我通过调整模型,并增加Dropout 层在一定程度上解决了过拟合的问题,同时我通过模型的优化调整使得我的分类精度也得到了很大的提升,最高可达到0.7509。在不断的优化过程中,我对于深度学习在图像分类中的前景越来越有信心,我也将继续在这个方向不断深入研究。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-04
摘要: 神经网络传感器 (Neural Transducer)和连接时序分类(Connectionist Temporal Classification,CTC)是流行的端到端自动语音识别系统。由于它们的帧同步 (Frame-synchronous)设计,空白(Blank)符号被引人以解决声学帧输人序列和输出标签序列之间的长度不匹配问题,这可能会带来冗余的计算。先前的研究通过丢弃联合训练的 CTC 所预测的空白帧来加速神经网络传感器的训练和推理。然而,这并不能保证联合训练的 CTC 能够最大限度地提高空白符号的占比。本文提出了两种新颖的正则化方法,通过约束 CTC 非空白符号的自循环(Self-loop),显式地鼓励 CTC 标记更多的空白符号,使得神经网络传感器获得更大程度的加速。在 LibriSpeech 语料库上的实验表明,本文提出的方法在不牺牲性能的前提下,将神经网络传感器的推理速度提高了 4 倍。此外,当神经网络传感器结合外部语言模型进行解码时,能够获得更大的性能提升。值得注意的是,本文提出的正则化方法能够让神经网络传感器的跳帧率逼近理论极限,这是首个探索几乎不含空白符号的神经网络传感器可行性的工作。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-12-18
摘要: In this paper, we propose a new approach to building a artificial general intelligence with selfawareness, which includes: (1) a new method to implement attention mechanisms; (2) a way to givemachines self-demands; (3) how to form a value evaluation system compatible with the network; (4) away to create the world models; (5) how to realize a top-down, hierarchical thinking decision-makingchain; (6) a way to achieve general decision-making and response capabilities; (7) a way for a machineto directly obtain human experience through language. In the paper, we first analyze some of the shortcomings of current LLMs (Large Language Model) and propose ideas for improvement. Then weanalyze why our scheme can solve the above problems and provide detailed steps for implementingour scheme. In chapter 6, we analyze the advantages and disadvantages of our scheme and proposefurther research directions. Finally, we propose our thoughts on the next step of AI development.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-12-05
摘要: Human parsing is a fundamental task aimed at segmenting human images into distinct body parts and holds vast potential applications. Nowadays, the advancement of image-capturing devices has led to a growing number of high-resolution human images. Receptive field, details loss and memory usage are a triplet of contradictions in high-resolution scenarios. Existing human parsing methods designed for low-resolution inputs struggle to process high-resolution images efficiently due to their massive demands for computation and memory. Some methods save resources by overwhelmingly downsampling or encoding high-resolution inputs at the cost of poor performance on details. To resolve the issues above, we propose the Bilateral Edge-Perceiving Network (BiEPNet), consisting of a resources-friendly semantic-perceiving branch to acquire sufficient global information and a simple yet effective edge-perceiving branch used to refine details. The attention mechanism is utilized to simultaneously enhance the perception of context and details, leading to better performance on the boundary regions. To verify the effectiveness of BiEPNet, we contribute a high-resolution human parsing dataset, Human4K, containing 4,000 images with more than five million pixels. Extensive experiments on Human4K demonstrate that our method outperforms state-of-the-art methods while maintaining memory efficiency.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-08-31
摘要: LLAMA 是最近几个月最流行的开源大语言模型,本文给出该模型的数学形式。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-08-15
摘要: At present, the mainstream artificial intelligence generally adopts the technical path of attentionmechanism + deep learning + reinforcement learning. It has made great progress in the field ofAIGC (Artificial Intelligence Generated Content), setting off the technical wave of big models[2][13].But in areas that need to interact with the actual environment, such as elderly care, home nanny,agricultural production, and vehicle driving, trial and error are expensive and a reinforcement learningprocess that requires much trial and error is difficult to achieve. Therefore, in order to achieveArtificial General Intelligence(AGI) that can be applied to any field, we need to use both existingtechnologies and solve the defects of existing technologies, so as to further develop the technologicalwave of artificial intelligence. In this paper, we analyze the limitations of the technical route of largemodels, and by addressing these limitations, we propose solutions, thus solving the inherent defectsof large models. In this paper, we will reveal how to achieve true AGI step by step.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-07-06
摘要: 在数据存储与传输中,文件压缩是减少数据量的常用技术,可减少数据存储空间和传输时间及带宽。然而,不同类型文件格式的压缩性能存在显著差异,收益也不同。本文收集22种文件格式,约178GB数据,采用Zlib算法进行压缩实验来比较性能,以研究不同文件类型的压缩收益。实验结果发现,某些文件类型的压缩效果较差,压缩后文件大小几乎不变,压缩时间长,收益较低;另一部分文件类型经过压缩后文件大小明显减小,压缩时间也较短,可以有效降低数据量。基于上述实验结果,本文后续将在数据存储和传输中针对文件类型有选择性的通过压缩来减少数据量,以获得最大压缩收益。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 力学其他学科 提交时间: 2023-06-15
摘要: 拓扑优化广泛应用于工程设计阶段,通过数学建模和优化设计空间中材料的分布来最大化产品性能。然而,解决拓扑优化问题的深度学习存在数据不足和训练模型边界条件适应性弱的问题。 因此,采用基于Topy库的数据样本生成方法,生成了随机结构、悬臂梁、连续梁和简支梁四种边界条件的400,000个二维样本,每种包含两类分辨率数据,并揭示了这一点数据集。提出了一种改进的 DoubleU-Net网络,用于实时高精度预测的拓扑优化。在生成的数据集中,随机梁、悬臂梁、连续梁和简支梁四种结构模型的平均IoU精度分别为93.26%、96.71%、96.35%和97.38%,实验结果表明 DoubleU-Net 可以更好地适应不同分辨率的数据。 使用随机结构数据集训练的模型泛化能力强,在大型项目实时结构优化方面具有巨大潜力。