您选择的条件: 崔运鹏
  • 古农文语义检索模型构建及其应用研究

    提交时间: 2024-04-03 合作期刊: 《农业图书情报学报》

    摘要: [目的/ 意义]构建能实现以白话文作为查询,系统自动返回与输入最相关的古农文段落的语义检索模型,为学者提 供更加便利的古代农业知识检索方式和古代农业知识溯源方式。[方法/ 过程]使用基于四库全书作为训练语料的SikuBERT 作 为基础模型,基于对比学习的方法,使用自建的古农文数据集对模型进行继续训练,得到能够支持使用白话文作为查询,返 回与查询语义最相似的古农文段落的语义检索模型。[结果/ 结论]古农文语义检索模型的Spearman 系数在测试集上的表现能 够达到86.51%,较基线模型在测试集上的表现83.69%有一定程度的提升,在自建的古农文检索测试集上的召回情况 渊recall@k冤较基线模型有一定程度提升,模型在古农文上能够有比较好的检索效果。但受限于古农文训练语料规模,模型的 训练效果还有很大提升空间。

  • 深度学习在植物基因组学与作物育种中的应用现状与展望

    分类: 其他 >> 综合 提交时间: 2023-03-31 合作期刊: 《农业图书情报学报》

    摘要: [目的/ 意义]随着单细胞测序、高通量技术的突破,植物基因组学也取得了巨大进步,可以低成本获取多维全基因 组分子表型的海量数据。深度学习技术可以作为强大的数据挖掘工具对获取的分子表型进行进一步预测和解释。当前研究表 明,深度学习在植物基因组学与作物育种研究任务中取得显著效果。但目前尚缺乏对于深度学习在植物基因组学中应用的完 整综述。[方法/ 过程]本文首先概述了深度学习方法背景,包括最新的图神经网络;随后着重从基因特性、蛋白质特性方面 综述了基因组学和深度学习交叉领域的两个突出问题:1冤如何对从植物基因组DNA 序列到分子表型的信息流进行建模? 2冤如何使用深度学习模型识别自然种群中的功能变异?[结果/ 结论]本文总结了当前研究中如何应用传统深度学习算法、图 深度学习、生成对抗网络以及可解释性AI 等方法解决上述两个问题。最后分析了深度学习在未来植物基因组学研究和作物遗 传改良中的发展前景。

  • 基于BERT 和深度主动学习的农业新闻文本分类方法

    分类: 其他 >> 综合 提交时间: 2023-03-31 合作期刊: 《农业图书情报学报》

    摘要: [目的/ 意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过 高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选 择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果。[方法/ 过程]将文本分类 常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT 模型结合3 种采样策略进行深度主动学习训练,在共 19 847 条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30 个样本标注的迭代实验进行测试。[结果/ 结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升。其中BERT 模型配合判别性主动学习采样函 数,具有最优的新闻文本分类效果和最低的标注数据需求。