分类: 环境科学技术及资源科学技术 >> 环境科学技术及资源科学技术其他学科 分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-09-22
摘要:目的 及时和准确的空气质量预测数据对于环境管理至关重要,尤其是在空气重污染期间,预测数据可以为政府生态环境管理部门应对污染状况、精准地调配社会资源的决策提供数据支撑。
方法 笔者研发的基于深度学习的空气质量预测模型AirNet6,可以兼顾准确性和实时性,实现臭氧、二氧化硫、一氧化碳等因子的7天甚至更长时间的空气质量预测。
结果 与传统的化学模型演算不同,本模型使用时空图卷积网络(STGCN),能捕获历史监测数据、天气预测数据、社会活动等数据的规律,在2分钟内完成一百多个点位未来168小时数据的预测。
结论 实验表明,AirNet6模型在速度、节能和准确度上,比传统的化学模型及时间序列AI模型均有明显进步。
关键词:空气质量预测、人工智能、深度学习模型、时空图卷积网络
分类: 计算机科学 >> 自然语言理解与机器翻译 分类: 图书馆学、情报学 >> 情报检索 分类: 管理学 >> 科学学与科技管理 分类: 其他 >> 综合 提交时间: 2023-09-22
摘要:Purpose/significance ChatGPT is a chatbot program developed by OpenAI in the United States. Conversations with ChatGPT can shed light on the scientific research in the age of AI. Method/process Currently, ChatGPT offers users 30 free query credits per day. By creating an outline for the conversation, Chen Yu engaged in a dialog with ChatGPT on various issues of the scientific research. Result/conclusion In the AI era, the AI technology represented by ChatGPT can become a "game-changer" in scientific research. Specifically, AI technology represented by ChatGPT can achieve faster data analysis, hypothesis generation, and decision making, trigger paradigm innovation in scientific research, promote interdisciplinary research, discover new research problems and research directions, lower the "barriers to entry" to scientific research, and promote scientific popularization and knowledge dissemination. At the same time, there are a number of potential risks associated with the use of AI technology represented by ChatGPT in scientific research, including privacy or data security issues, over-reliance on AI technology, rigidity of thinking, stereotyping or even prejudice against certain genders, races, cultures, languages and ideologies, intellectual property rights, workforce adaptation, academic misconduct, and digital hegemony or AI hegemony in the English-speaking world.
分类: 计算机科学 >> 自然语言理解与机器翻译 分类: 图书馆学、情报学 >> 情报检索 分类: 其他 >> 综合 分类: 管理学 >> 科学学与科技管理 提交时间: 2023-09-22
摘要: 目的/意义 ChatGPT是美国OpenAI公司研发的一种聊天机器人程序。与ChatGPT进行对话,能够为AI时代的科学研究提供启示。 方法/过程 目前,ChatGPT每日向用户免费提供30次的查询额度。陈瑜通过精心设计对话提纲,与ChatGPT就科学研究的若干问题展开了对话。 结果/结论 在AI时代,以ChatGPT为代表的AI技术可能成为科学研究中的“规则改变者”。具体来说,以ChatGPT为代表的AI技术可以实现更快的数据分析、假设生成和决策制定,引发科学研究的范式创新,推动跨学科研究,发现新的研究问题和研究方向,降低科学研究的“准入障碍”,推动科学普及和知识传播等。同时,在科学研究中运用以ChatGPT为代表的AI技术可能存在一系列的潜在风险,包括隐私或数据安全问题,对AI技术的过度依赖,思维僵化,对特定性别、种族、文化、语言和意识形态的刻板印象甚至偏见,知识产权问题,劳动力适应问题,学术不端问题,以及英语世界的数字霸权或AI霸权等。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-09-06
摘要:In this study, an adaptively hybrid method was proposed to improve the performance of fractal coding methods. First, we found that the range blocks with large variances (RBLVs) play a crucial role in degrading decoded images, and the effect of the remaining range blocks with small variances (RBSVs) can be ignored. Second, RBLVs were designed to be encoded in an extended domain block pool (EDBP), and the remaining RBSVs were encoded with the no-search fractal encoding method. Moreover, an effective method to adaptively divide the range blocks into the above two categories was proposed. Finally, four fractal coding methods were adopted to assess the performance of the proposed method. Experimental results show that, compared with the previous methods, the proposed method can achieve better-decoded image quality with fewer bits per pixel and fewer computations.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-08-31
摘要:LLAMA 是最近几个月最流行的开源大语言模型,本文给出该模型的数学形式。
分类: 数学 >> 统计和概率 分类: 统计学 >> 数理统计学 分类: 信息科学与系统科学 >> 信息科学与系统科学基础学科 分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-08-27
摘要:统计独立性是统计学和机器学习领域的基础性概念,如何表示和度量统计独立性是该领域的基本问题。Copula理论提供了统计相关关系表示的理论工具,而Copula熵理论则给出了度量统计独立性的概念工具。本文综述了Copula熵的理论和应用,概述了其基本概念定义、定理和性质,以及估计方法。介绍了Copula熵研究的最新进展,包括其在统计学的九个基本问题(结构学习、关联发现、变量选择、因果发现、系统辨识、时延估计、域自适应、正态性检验和双样本检验等)上的理论应用。讨论了前四个理论应用之间的关系,以及其对应的深层次的相关性和因果性概念之间的联系,并将Copula熵的(条件)独立性度量框架与基于核函数和距离相关的同类框架进行了理论对比,又通过仿真和实际数据实验评估验证了Copula熵的实际优越性。简述了Copula熵在理论物理学、理论化学、化学信息学、材料学、水文学、气候学、气象学、环境学、生态学、动物形态学、农学、认知神经学、运动神经学、计算神经学、心理学、系统生物学、生物信息学、临床诊断学、老年医学、精神病学、公共卫生学、经济学、管理学、社会学、教育学、计算语言学、新闻传播学、法学、政治学、军事学、情报学,以及能源工程、食品工程、土木建筑、交通运输、制造工程、可靠性工程、化学工程、航空航天、车辆工程、电子工程、通信工程、高性能计算、测绘遥感和金融工程等领域的实际应用。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-08-25
摘要:To predict fractal decoded image quality more efficiently, an effective decoded image quality prediction method was proposed in this study. In fractal encoding process, the dynamic range of the linear correlation coefficients (LCCs) between range blocks and their best-matched domain blocks was greatly extended by several outliers which increased uncertainty and resulted in reduced prediction accuracy. To remove the interference of outliers, we introduced the effective minimum and maximum of LCCs, which provided the effective bottom and top limits of the actual percentage of accumulated collage error (EBL-APACE and ETL-APACE), respectively. Further, when EBL-APACE reached a large percentage, the average collage error (ACER) can be estimated, and the decoded image quality can be predicted directly.
Experimental results show that compared with the previous method, the proposed method can provide higher prediction accuracy with fewer computations.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-08-15
摘要:At present, the mainstream artificial intelligence generally adopts the technical path of "attention mechanism + deep learning" + "reinforcement learning". It has made great progress in the field of AIGC (Artificial Intelligence Generated Content), setting off the technical wave of big models[2][13]. But in areas that need to interact with the actual environment, such as elderly care, home nanny, agricultural production, and vehicle driving, trial and error are expensive and a reinforcement learning process that requires much trial and error is difficult to achieve. Therefore, in order to achieve Artificial General Intelligence(AGI) that can be applied to any field, we need to use both existing technologies and solve the defects of existing technologies, so as to further develop the technological wave of artificial intelligence. In this paper, we analyze the limitations of the technical route of large models, and by addressing these limitations, we propose solutions, thus solving the inherent defects of large models. In this paper, we will reveal how to achieve true AGI step by step.
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2023-07-29
摘要:目前主流的人工智能,普遍采用“注意力机制 + 深度学习”+“强化学习”的技术道路。在 AIGC(Artificial Intelligence Generated Content)领域取得了长足进步,掀起了大模型的技术浪潮。但在那些需要和实际环境互动的领域,比如老人护理,家庭保姆,农业生产,车辆驾驶等领域,试错成本很高,需要大量试错的强化学习过程难以实现。所以,要想实现能适用于任何领域的通用人工智能,我们既要利用现有技术,又要解决现有技术的缺陷,从而推动人工智能的技术浪潮进一步发展。在本文中,我们分析了大模型技术路线的局限性,并针对这些局限性,提出了解决方案,从而解决了大模型的固有缺陷。在本文中,我们将揭示如何一步一步实现通用人工智能。
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2023-07-12
摘要:以 LLAMA 为代表的开源大语言模型广泛使用旋转位置编码,原始论文使用复函数推导。本文改用线性代数推导,期望更好地理解该编码方法;提出该方法的一个疑点并给出了改进建议。
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2023-07-11
摘要:临床术语标准化对于处理电子病历中临床术语不规范问题具有重要的研究意义。目前主流的解决方法是采用“召回-排序”的策略。该文基于中国健康信息处理大会(CHIP2021)评测3中提供的数据集,提出了一个基于多策略的临床术语标准化方法,在召回阶段,采用全匹配策略、相似原词的标准词推荐以及基于TF-IDF与改进的Jaccard系数的相似度计算去召回候选的标准词集合。同时,该文构建了基于BERT模型的标准词数量预测模型,利用对抗训练、Focal Loss与标签平滑策略有效地提高了模型的预测性能和泛化性能。在排序阶段,该文利用基于对抗训练与诊断信息融合的BERT蕴含分数排序模型对候选词集合排序,再根据数量预测模型输出的结果生成最终预测的标准词。在最终的评测中,该文方法准确率达到0.6356,在参赛队伍中位列第二名。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-07-06
摘要:在数据存储与传输中,文件压缩是减少数据量的常用技术,可减少数据存储空间和传输时间及带宽。然而,不同类型文件格式的压缩性能存在显著差异,收益也不同。本文收集22种文件格式,约178GB数据,采用Zlib算法进行压缩实验来比较性能,以研究不同文件类型的压缩收益。实验结果发现,某些文件类型的压缩效果较差,压缩后文件大小几乎不变,压缩时间长,收益较低;另一部分文件类型经过压缩后文件大小明显减小,压缩时间也较短,可以有效降低数据量。基于上述实验结果,本文后续将在数据存储和传输中针对文件类型有选择性的通过压缩来减少数据量,以获得最大压缩收益。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-07-01
摘要:[目的] 本研究旨在提出一种基于词和词性的联合文本生成模型,以提高生成文本的质量。
[方法] 该模型由两个预训练的文本生成模型组成,一个是基于词的模型,另一个是基于词性的模型。此外,本文还提出并使用了BERT模型对进行二分类任务,以判断文本生成效果。
[结果] 在三个数据集上的实验结果表明,与传统的GPT模型相比,GPT-WP模型生成文本的质量有明显提升。
[局限] BERT模型在二分类任务中参数较大,大规模数据训练下评价效果差,本文提出的模型在数据量较小的场景下表现较好,大规模数据表现差异缩小。
[结论] GPT-WP模型在本文提出的评价方法下表明其能够有效地提高生成文本的质量,对于自然语言生成任务的改进和评估提供了参考。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 力学其他学科 提交时间: 2023-06-15
摘要:拓扑优化广泛应用于工程设计阶段,通过数学建模和优化设计空间中材料的分布来最大化产品性能。然而,解决拓扑优化问题的深度学习存在数据不足和训练模型边界条件适应性弱的问题。 因此,采用基于Topy库的数据样本生成方法,生成了随机结构、悬臂梁、连续梁和简支梁四种边界条件的400,000个二维样本,每种包含两类分辨率数据,并揭示了这一点数据集。提出了一种改进的 DoubleU-Net网络,用于实时高精度预测的拓扑优化。在生成的数据集中,随机梁、悬臂梁、连续梁和简支梁四种结构模型的平均IoU精度分别为93.26%、96.71%、96.35%和97.38%,实验结果表明 DoubleU-Net 可以更好地适应不同分辨率的数据。 使用随机结构数据集训练的模型泛化能力强,在大型项目实时结构优化方面具有巨大潜力。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 振动与波 提交时间: 2023-06-15
摘要:本文基于膨胀残差卷积宽度网络提出一种模态分析的策略。在模态分析中,大规模结构或复杂系统的振动分析通常需要处理大量的数据和复杂的计算。采用膨胀残差卷积宽度架构可以降低网络的参数量和计算复杂度,减轻计算负担,提高分析的效率。膨胀残差卷积宽度网络应用于模态分析任务能够提升振动特征的提取能力、改善模态识别的准确性、增强结构损伤检测的敏感性,并且具有较高的计算效率和参数效率。实验结果表明,我们的模型在模态分析预测的回归任务中取得了优异的成绩。
分类: 计算机科学 >> 信息安全 提交时间: 2023-05-30
摘要:自从互联网提出以来,网络的匿名性一直是一个公众关注的重要议题。从保证电子选举公平性到保护用户隐私,匿名性起着越来越重要的作用。随着匿名网络的提出,对于公众而言,匿名性得到了一定的保障。但随着匿名对抗技术的不断升级,匿名性也逐渐面临着威胁。本文以匿名性及其保障与对抗技术为主线,综述了匿名网络及其对抗技术的发展。文章主要以网站指纹技术的发展论述人工智能技术在匿名网络中的应用。自从互联网提出以来,网络的匿名性一直是一个公众关注的重要议题。从保证电子选举公平性到保护用户隐私,匿名性起着越来越重要的作用。随着匿名网络的提出,对于公众而言,匿名性得到了一定的保障。但随着匿名对抗技术的不断升级,匿名性也逐渐面临着威胁。本文以匿名性及其保障与对抗技术为主线,综述了匿名网络及其对抗技术的发展。文章主要以网站指纹技术的发展论述人工智能技术在匿名网络中的应用。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-05-22
摘要:目的 当前,基于规则的知识图谱推理方法不断涌现,但缺乏系统的归类和分析。本文梳理了基于规则的知识图谱推理相关研究工作。
方法 对相关经典方法的核心思路、关键技术和优缺点进行阐述分析,并对不同类型方法的性能进行比较。
结果 本文归纳出4类方法,包括基于归纳逻辑编程的方法、基于概率图和规则的方法、基于嵌入表示和规则的方法和基于神经网络和规则的方法。
局限 相关方法的具体应用研究目前还比较少。
结论 基于规则的知识图谱推理方法通过挖掘底层逻辑规则执行推理,泛化能力和可解释性较强,基于规则的混合推理方法在未来仍有较大应用前景。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-05-16
摘要:目的 解决长尾商品的推荐中存在的样本数据偏少,现有协同过滤法计算量大,性能难以满足需求的问题
方法 出了基于GAN+XGBoost+LR的解决方案,通过协同过滤寻找初始样本数据,利用GAN生成更多样本数据训练XGBoost+LR模型,并针对不同模型的特点指定针对性的训练策略。
结果 该方案在兼顾性能和精确度要求下,可以提高推荐模型的鲁棒性。
局限 XGBoost模型承担自动化特征工程能力有限。
结论 基于GAN+XGBoost+LR的个性化推荐方法可以提高长尾商品的推荐的有鲁棒性。
分类: 计算机科学 >> 计算机应用技术 分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-05-12
摘要:目的/意义:随着以ChatGPT为代表大语言模型技术的不断发展与变革,使得许多领域的经典场景都重新焕发出新的机会。同时,越来越多的学者开始关注如何将大语言模型的智能化能力与技术应用到现有的场景,并分析这些技术带来的挑战和机遇。 方法/过程:本文以ChatGPT为建模对象,首次将大语言模型技术引入用户图书评分偏好预测这一图情领域的典型应用场景,并落地实践。通过构建基于ChatGPT的用户图书评分预测模型(CUBR, ChatGPT-based model for User Book Rating Prediction),来探索大语言模型技术在图书推荐领域实践和落地的可行性。同时,本文基于图书评分任务的不同评估方案与现有经典推荐模型进行对比,探讨并给出了CUBR在用户图书评分预测场景的优势与劣势,并分析了后续大语言模型在图书推荐其他场景可能的研究机会点。 结果/结论:本文实验研究表明,(1)CUBR模型在现有用户图书评分偏好预测任务上能够取得不错的推荐效果,特别是单样本(One-shot)这类待推荐目标信息较少的情况下,其表现接近或超过当前经典推荐算法,且泛化能力较强,较适用于冷启动推荐场景。(2)随着单个用户提示样本内容的增加(如从One-shot到Ten-shot),CUBR的预估效果会有显著的提升,说明CUBR具备不错的实时上下文学习能力。 局限:本文研究场景仅限于用户图书评分偏好理解与推荐,未来将尝试在更多的图情场景应用和改造现有大语言模型技术,并获得更好的实践效果。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2023-05-06
摘要:With a preliminary exploration of the capability boundaries of LLM(Language Large Model),we believe that the current mainstream artificial intelligence generally adopts the technical of "attention mechanism + deep learning" + "reinforcement learning", which cannot be applied to those fields that are difficult to a lot of "trial and error". So, to achieve AGI (Artificial General Intelligence) that works in any field, it’s better to change the way we do it. Therefore, we propose a set of machine learning solution different from "deep learning + reinforcement learning". It adopts small samples and cumulative learning, and also realizes the attention mechanism similar to transformer, and also creates a fully connected knowledge network. In addition, it can realize interactive decision making with the environment without using lots of "trial and error" style learning. In addition, humans can preset different innate needs to it to achieve multi-objective balance, thus achieving far higher security than the current artificial intelligence. In this paper, we propose a set of new machine learning techniques which maybe guide humans realizes AGI