分类: 天文学 >> 天文学 提交时间: 2020-06-09 合作期刊: 《天文研究与技术》
摘要: 环境信息是大天区面积多目标光纤光谱望远镜(LAMOST,即郭守敬望远镜)运行状态的一部分,用于辅助望远镜的日常维护、观测以及后期数据处理。环境信息来源于多个子系统,而子系统的数据存储由不同单位设计,使得数据存储环境复杂,不利于统一检索。基于异步协程,我们提出了一种异构环境信息检索的方法。该方法利用数据库代理对象工厂整合多个数据库及检索字段信息,通过客户端和Web浏览器提供远程服务,以自定义检索命令的方式实现对异构数据库的检索。本方法充分考虑了后期升级的需求,保留多种数据库和应用接口,便于更多数据库和应用的接入。目前基于该方法开发的检索系统已部署于LAMOST运行环境,在实际运行中简化了运行环境检索操作,提高了工作效率和数据获取的精准度,提升了维护和观测效率。
分类: 天文学 >> 天文仪器与技术 提交时间: 2018-06-22 合作期刊: 《天文研究与技术》
摘要: 现代大型天文望远镜的控制一般由多台独立(或组成集群)的计算机来完成。这些计算机的性能、效率与可靠性直接影响整个望远镜的稳定运行。因此,需要研制一套实时对各控制计算机(节点)硬件资源信息进行采集、存储、监控的软件系统,并提供一定的预警功能。这样的系统可以有效排除隐患进而提高望远镜整体观测运行效率。本文在深入分析LAMOST望远镜观测运行需求的基础上,采用异步协程技术,设计和开发了一套基于Python语言的硬件资源监控系统软件,系统可以高效稳定地采集获取计算机各种状态,也可以获得相应部件的实时信息,并提供了多种人机交互方式,为后续开发提供了扩展接口。该系统部署于LAMOST环境中,实际运行表明整个系统取得了较好的效果。
分类: 计算机科学 >> 计算机软件 分类: 语言学及应用语言学 >> 语言学及应用语言学 提交时间: 2024-04-21
摘要: 此幻灯片从背景、动机、方法、效果、展望和致谢六方面讲述了《引导大语言模型生成计算机可解析内容》的研究。全文请参考:https://arxiv.org/abs/2404.05499
分类: 计算机科学 >> 计算机软件 分类: 语言学及应用语言学 >> 语言学及应用语言学 提交时间: 2024-04-07
摘要: 大语言模型 (Large Language Models, LLMs) 能够从大量语料的上下文中学习到模式,其包括词语之间的关系、句子的结构甚至更复杂的语义和语用信息。然而,让预训练语言模型生成结构化、严格遵循约定的内容仍然是一项挑战。本文提出了一种引导LLMs生成计算机高可用内容的方案,无需微调和额外的神经网络推理,通过提前约定的上下文无关文法 (Context-Free Grammar, CFG) 引入基于协程的内容生成约束机制,在自回归模型Transformer的解码阶段引导模型采样正确的词元,以构成符合程序约定的形式语言。这将有效地提升LLMs生成目标数据结构、类型或指令的稳定性和一致性,降低应用开发和集成的难度。本文作者先通过“匹配括号对”实验验证了GPT-2和Gemma等模型在生成DSL长度分别大于36和282时错误率就达到了95%,说明了当前LLMs在特定DSL生成上的性能问题。本文作者还提出了基于协程的DSL生成框架YieldLang,并使用LLMs在多个任务数据集上进行了实验,包括JSON、Mermaid流图和函数调用表达式生成等任务。这些实验表明本文的方法相比基准,其准确率提升到了原来的109%到1160%,并且在最好的情况下能够将LLMs生成JSON的采样次数降低到基准的约16.5%,这将有效地提高LLMs生成内容对计算机程序的可用性。