分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-08-31
摘要:LLAMA 是最近几个月最流行的开源大语言模型,本文给出该模型的数学形式。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-08-15
摘要:At present, the mainstream artificial intelligence generally adopts the technical path of "attention mechanism + deep learning" + "reinforcement learning". It has made great progress in the field of AIGC (Artificial Intelligence Generated Content), setting off the technical wave of big models[2][13]. But in areas that need to interact with the actual environment, such as elderly care, home nanny, agricultural production, and vehicle driving, trial and error are expensive and a reinforcement learning process that requires much trial and error is difficult to achieve. Therefore, in order to achieve Artificial General Intelligence(AGI) that can be applied to any field, we need to use both existing technologies and solve the defects of existing technologies, so as to further develop the technological wave of artificial intelligence. In this paper, we analyze the limitations of the technical route of large models, and by addressing these limitations, we propose solutions, thus solving the inherent defects of large models. In this paper, we will reveal how to achieve true AGI step by step.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-07-06
摘要:在数据存储与传输中,文件压缩是减少数据量的常用技术,可减少数据存储空间和传输时间及带宽。然而,不同类型文件格式的压缩性能存在显著差异,收益也不同。本文收集22种文件格式,约178GB数据,采用Zlib算法进行压缩实验来比较性能,以研究不同文件类型的压缩收益。实验结果发现,某些文件类型的压缩效果较差,压缩后文件大小几乎不变,压缩时间长,收益较低;另一部分文件类型经过压缩后文件大小明显减小,压缩时间也较短,可以有效降低数据量。基于上述实验结果,本文后续将在数据存储和传输中针对文件类型有选择性的通过压缩来减少数据量,以获得最大压缩收益。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 力学其他学科 提交时间: 2023-06-15
摘要:拓扑优化广泛应用于工程设计阶段,通过数学建模和优化设计空间中材料的分布来最大化产品性能。然而,解决拓扑优化问题的深度学习存在数据不足和训练模型边界条件适应性弱的问题。 因此,采用基于Topy库的数据样本生成方法,生成了随机结构、悬臂梁、连续梁和简支梁四种边界条件的400,000个二维样本,每种包含两类分辨率数据,并揭示了这一点数据集。提出了一种改进的 DoubleU-Net网络,用于实时高精度预测的拓扑优化。在生成的数据集中,随机梁、悬臂梁、连续梁和简支梁四种结构模型的平均IoU精度分别为93.26%、96.71%、96.35%和97.38%,实验结果表明 DoubleU-Net 可以更好地适应不同分辨率的数据。 使用随机结构数据集训练的模型泛化能力强,在大型项目实时结构优化方面具有巨大潜力。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 振动与波 提交时间: 2023-06-15
摘要:本文基于膨胀残差卷积宽度网络提出一种模态分析的策略。在模态分析中,大规模结构或复杂系统的振动分析通常需要处理大量的数据和复杂的计算。采用膨胀残差卷积宽度架构可以降低网络的参数量和计算复杂度,减轻计算负担,提高分析的效率。膨胀残差卷积宽度网络应用于模态分析任务能够提升振动特征的提取能力、改善模态识别的准确性、增强结构损伤检测的敏感性,并且具有较高的计算效率和参数效率。实验结果表明,我们的模型在模态分析预测的回归任务中取得了优异的成绩。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-05-22
摘要:目的 当前,基于规则的知识图谱推理方法不断涌现,但缺乏系统的归类和分析。本文梳理了基于规则的知识图谱推理相关研究工作。
方法 对相关经典方法的核心思路、关键技术和优缺点进行阐述分析,并对不同类型方法的性能进行比较。
结果 本文归纳出4类方法,包括基于归纳逻辑编程的方法、基于概率图和规则的方法、基于嵌入表示和规则的方法和基于神经网络和规则的方法。
局限 相关方法的具体应用研究目前还比较少。
结论 基于规则的知识图谱推理方法通过挖掘底层逻辑规则执行推理,泛化能力和可解释性较强,基于规则的混合推理方法在未来仍有较大应用前景。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-05-06
摘要:With a preliminary exploration of the capability boundaries of LLM(Language Large Model),we believe that the current mainstream artificial intelligence generally adopts the technical of "attention mechanism + deep learning" + "reinforcement learning", which cannot be applied to those fields that are difficult to a lot of "trial and error". So, to achieve AGI (Artificial General Intelligence) that works in any field, it’s better to change the way we do it. Therefore, we propose a set of machine learning solution different from "deep learning + reinforcement learning". It adopts small samples and cumulative learning, and also realizes the attention mechanism similar to transformer, and also creates a fully connected knowledge network. In addition, it can realize interactive decision making with the environment without using lots of "trial and error" style learning. In addition, humans can preset different innate needs to it to achieve multi-objective balance, thus achieving far higher security than the current artificial intelligence. In this paper, we propose a set of new machine learning techniques which maybe guide humans realizes AGI
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-04-15
摘要:AI is extraordinarily useful technology but it is becoming increasingly powerful with rapidly growing capabilities to disrupt and harm human society. We call on international and national organizations and individuals to join forces in banning the development of superintelligent AI and introducing regulations to prevent and mitigate AI-caused harm.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-03-22
摘要:To address the challenges of long-tailed classification, researchers have proposed several approaches to reduce model bias, most of which assume that classes with few samples are weak classes. However, recent studies have shown that tail classes are not always hard to learn, and model bias has been observed on sample-balanced datasets, suggesting the existence of other factors that affect model bias. In this work, we systematically propose a series of geometric measurements for perceptual manifolds in deep neural networks, and then explore the effect of the geometric characteristics of perceptual manifolds on classification difficulty and how learning shapes the geometric characteristics of perceptual manifolds. An unanticipated finding is that the correlation between the class accuracy and the separation degree of perceptual manifolds gradually decreases during training, while the negative correlation with the curvature gradually increases, implying that curvature imbalance leads to model bias. Therefore, we propose curvature regularization to facilitate the model to learn curvature-balanced and flatter perceptual manifolds. Evaluations on multiple long-tailed and non-longtailed datasets show the excellent performance and exciting generality of our approach, especially in achieving significant performance improvements based on current state-ofthe-art techniques. Our work opens up a geometric analysis perspective on model bias and reminds researchers to pay attention to model bias on non-long-tailed and even samplebalanced datasets. The code and model will be made public.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-03-01
摘要:近年来,随着计算机视觉领域的快速发展,数字人的概念引起社会各界的广泛关注,高保真的人体、人头和人手的建模都得到了深入的研究。本文关注头部建模,基于神经辐射场提出一种可泛化的人头模型,结合人脸识别网络和人脸三维形变模型,将头部模型参数化,因此可以直接控制生成图像的身份和表情语义属性,并且支持自由编辑图像的渲染姿态。为了提高神经辐射场的渲染速度,我们将传统的体渲染改为体渲染结合二维神经渲染的方式,在保留渲染图像质量的同时在Tesla V100 GPU上达到15帧/秒的渲染速度。通过采集大量的头部RGB图像数据参与训练,模型可以生成高保真的渲染图像,并且在测试集上也有逼真的拟合结果,可以泛化到未曾参与训练的新的身份和表情语义。得益于神经辐射场对三维几何场景的隐式表示能力,模型的渲染结果具有多视角一致性,在新视角合成、表情迁移、驱动等方面有多种用途。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-01-17
摘要:云计算可解决移动设备计算资源不足的问题,但无法满足低时延的服务需求,边缘计算作为云计算技术的延伸,可通过增强边缘网络计算能力从而为用户提供低时延高质量服务。边缘计算中,需要将服务部署于资源受限的边缘服务器,并根据需求合理分配计算资源,以提高边缘服务器资源利用率,为此,本文提出了一种基于深度强化学习的服务资源分配方法,利用反正切函数两次映射建立计算资源分配函数,并实现分配比例的动态调整,最后基于真实数据集进行仿真实验,实验结果表明,本文提出的方法能够在保证低时延的情况下,合理分配计算资源。 云计算可解决移动设备计算资源不足的问题,但无法满足低时延的服务需求,边缘计算作为云计算技术的延伸,可通过增强边缘网络计算能力从而为用户提供低时延高质量服务。边缘计算中,需要将服务部署于资源受限的边缘服务器,并根据需求合理分配计算资源,以提高边缘服务器资源利用率,为此,本文提出了一种基于深度强化学习的服务资源分配方法,利用反正切函数两次映射建立计算资源分配函数,并实现分配比例的动态调整,最后基于真实数据集进行仿真实验,实验结果表明,本文提出的方法能够在保证低时延的情况下,合理分配计算资源。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-11-15
摘要:
Few-shot learning has been proposed and rapidly emerging as a viable means for completing various tasks. Many few-shot models have been widely used for relation learning tasks. However, each of these models has a shortage of capturing a certain aspect of semantic features, for example, CNN on long-range dependencies part, Transformer on local features. It is difficult for a single model to adapt to various relation learning, which results in a high variance problem. Ensemble strategy could be competitive in improving the accuracy of few-shot relation extraction and mitigating high variance risks. This paper explores an ensemble approach to reduce the variance and introduces fine-tuning and feature attention strategies to calibrate relation-level features. Results on several few-shot relation learning tasks show that our model significantly outperforms the previous state-of-the-art models.
分类: 图书馆学、情报学 >> 情报学 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-08-30
摘要:
目的 知识可视化是知识社会重要的知识再生产工具,其设计研究反映了人们对新形式知识创造的努力探索。 方法 研究借助文献计量分析工具Vosview和Citespace 以及自主梳理方法,以“知识可视化设计”为关键词对1985-2022年间国内外文献进行检索和分析。 结果 解析了知识可视化国际设计研究发展的辩证历程和国内研究的现状。 局限 研究认为知识可视化领域需要一个普遍的框架来协调大量碎片化的研究. 结论 知识可视化设计应进一步丰富研究层次多元化设计者的认识视角,设计应以唯物辩证法把握发展趋势清晰设计研究道路。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 物理学 >> 凝聚态:电子结构、电、磁和光学性质 提交时间: 2022-08-15
摘要:随着高性能计算体系结构的发展,软件与硬件都具有了多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,具有非常多的分配对应方式。用户越来越难以获取最佳的计算并行参数与硬件资源使用量。我们研究了一种优化方法,可以帮助用户自动化的确定最佳的应用并行参数与硬件使用量,使其可以高效率地扩展到大规模计算。此外,我们提出了一种将该优化方法与作业调度系统深度融合的方案,并获得了很好的应用效果。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-06-28
摘要:
平方公里阵列 (Square Kilometre Array, SKA) 射电望远镜的数据处理是通过管线方式进行的, 管 线的执行效率是 SKA 区域中心考虑的重要因素. 连续谱成像观测是 SKA 的主要观测模式之一, 也是许 多科学工作的基础. 本文以 SKA 低频先导设备 (Murchison Widefield Array, MWA) 的成像管线为例, 在 中国 SKA 区域中心原型机 (China SKA Regional Centre prototype, CSRC-P) 上进行并行处理管线优化. 以往的优化方案都集中在少数性能热点, 缺乏对整体管线的系统优化, 导致整体加速比相对较低. 针对这一 问题, 本文提出了一种全局优化方案, 针对管线使用多种编程语言、图像数据可独立处理的特点, 综合使用 C + + 多线程、Python 多进程、Shell 多任务并行等优化方法, 并验证了优化结果的准确性. 实验表明, 优 化后的代码在 CSRC-P 的 x86 节点和 ARM 节点上分别获得了 2.7 和 2.4 倍加速. ARM 计算节点展现出 对 SKA 应用良好的适应性. 本文的优化策略和方法也适用于其他 SKA 科学应用, 对 SKA 先导望远镜的 科学运行和未来的运行有帮助.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-06-28
摘要:
随着平方公里阵列射电望远镜(SKA)等大科学装置的建设和运行,以及大数据和高性能计算创 新平台的提出,天文学与高性能计算之间的联系日趋紧密. 天文学计算,特别是作为 SKA 的主要科学方 向之一的脉冲星搜索,具有数据量大、计算量多的特点. 本文介绍了一种基于 OpenMP 多线程和多进程 技术来加速脉冲星搜索流程的方案,提出了一种解决负载不平衡问题的方法,并成功的将优化流程安装于 中国 SKA 区域中心原型机的 x86 和 ARM 计算节点. 通过默奇森大视场阵列望远镜(MWA)的脉冲星观 测数据搜寻测试,与原始单线程方法相比,流程分别获得 10.4–12.2 和 24.5–27.6 倍的加速比. 其中 ARM 平台比 x86 平台的计算快 1.1–1.3 倍,显示出其在 SKA 数据处理方面的巨大潜力. 在中国 SKA 区域中心 原型机上部署的脉冲星优化搜索流程,近期将重点应用于 MWA 南天快速两米巡天(SMART)项目的低 频脉冲星搜寻,以满足包括引力波探测计时阵在内的多种科学需要。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-01-02
摘要: [目的]当标注数据较少时,现有模型受训练数据量少的限制,参数没有拟合到预期效果,导致在低资源命名实体识别任务中模型识别性能不佳。[方法]本文提出一种融入伯努利分布(Bernoulli distribution)的新型损失函数,让模型较好拟合数据。此外,本文在BiLSTM-CRF模型基础上融合多层字符特征信息,结合基于伯努利分布的新型损失函数,构建了BiLSTM-BCRF模型。[结果]本文提出的BiLSTM-BCRF模型在20%的CoNLL2003和20%的BC5CDR的数据集上,F1值在BiLSTM-CRF模型基础上分别提升了6.16%、3.35%。[结论]该模型能较好地适应低资源命名实体识别任务。[局限]该模型识别专有名词的性能还有待提升。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 心理学 >> 心理学其他学科 提交时间: 2021-12-21
摘要: Game map is an important human-computer interactive content-bearing platform in major games. With the application of cellular automata(CA) and Procedural Content Generation (PCG)in map generation, the spatial scale and data volume of current game maps are increasing greatly, while in game map test procedure, automatic methods such as interactive test script are inadequate both in depth and application breadth, especially in the lack of game map evaluation from player experience perspective. This research proposes an automatic game map test method based on agent reinforcement learning. By establishing agents’ interactive action models standing for different types of players’ behaviors in the map, universal evaluation of the map environment is enhanced through agent actions, which can optimize game map design from the perspective of player experience with quantitative value of inferiority. Finally, our campus scenes in Minecraft were used as the experimental environments to verify the effectiveness of the method.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-12-20
摘要: 针对现有基于Tacotron模型的蒙古语语音合成系统存在的两个问题:1)难以实时合成;2)合成语音保真度较低,该文基于FastSpeech2模型提出了完全非自回归的实时、高保真蒙古语语音合成模型MonTTS。为了提高MonTTS模型合成蒙古语语音的韵律自然度/保真度,根据蒙古语声学特点提出以下三点创新改进:1)使用蒙古文音素序列来表征蒙古文发音信息;2)提出音素级的声学调节器以学习长时韵律变化;3)提出基于蒙古语语音识别和自回归语音合成两种时长对齐方法。同时,该文构建了一个当前最大规模的蒙古语语音合成数据库:MonSpeech。实验结果表明MonTTS在韵律自然度方面的主观平均意见分数(Mean Opinion Score,MOS)达到4.53,显著优于当前最优的基于Tacotron的蒙古语语音合成基线系统和基线FastSpeech2模型;MonTTS合成实时率达3.63×10-3,满足实时高保真合成要求。最后,文中涉及的训练脚本和预训练模型全部开源(https://github.com/ttslr/MonTTS)。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-11-25
摘要: 驾驶人是“人-车-环境”道路交通系统的核心,研究驾驶人的感知-行为模式对于规范驾驶行为、提高安全水平具有重要意义。然而,当前的研究很少涉及驾驶中头动与器官协调性,尤其缺乏量化计算的研究。因此,本文设计了虚拟现实下的匀速平稳驾驶实验,并使用信息论工具进行建模、分析。我们研究了头、眼、手、脚四种运动器官的协调性,提出了基于传递熵的因果网络用来描述四者间的协作模式,提出了使用网络平均传递熵作为评估驾驶中器官协调性的一种指标。最后,我们还发现,在驾驶中头-眼协调性非常强,配合紧密度高;在转弯时各器官间的协调性比在直行时强;在平稳匀速驾驶任务中,驾驶人对行为任务的优先级高于感知任务。