分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-02-20
摘要: 本文分析了目前LLM存在的主要问题,并提出了具体解决方法,指出了:结合概率的概念化结构模型的表达和计算是关键,并对相关技术—深度语义模型(DSM)进行了简要的讲解,最后列举了后续的重点工作方向。
分类: 医学、药学 >> 预防医学与公共卫生学 分类: 统计学 >> 生物与医学统计学 提交时间: 2024-05-06
摘要: 极端不平衡数据定义为自变量或因变量指标的取值呈现严重比例失衡的数据,例如病例-对照极度不平衡、疾病发病率极低、生存数据大量删失以及遗传位点为低频或罕见变异等。在此情境下,logistic回归模型、Cox比例风险模型等参数假设检验的经典统计量偏离正态分布,难以控制一类错误。近年来,随着超大型人群队列全基因组关联研究资源的日益共享与深度挖掘,高效准确处理独立或非独立样本极端不平衡数据的统计需求日益突出。为此,本文系统地进行了方法学概述。首先,综述常见经典统计量理论推导的原理;其次,阐述极端不平衡数据对统计量分布的影响;然后,介绍遗传统计学中常用的两种统计量校正方法:Firth校正和鞍点近似方法;最后,简介极端不平衡基因组学数据常用软件。本文为极端不平衡数据的统计分析提供理论参考和应用推荐。
分类: 生物学 >> 生态学 提交时间: 2017-03-08 合作期刊: 《生态学报》
摘要: 利用采自天山西部赛里木湖流域的树木年轮标准化宽度年表,重建了赛里木湖流域过去373年上年8月到当年7月的降水变化,重建序列的解释方差达到39.8%,多方验证表明,重建结果是稳定可靠的。分析历史降水变化特征表明,赛里木湖流域过去373年的降水经历了6干7湿的阶段变化,其中,持续最长的干旱阶段为1762-1791年,而最为干旱的阶段为1841-1865年;持续最长的湿润阶段为1794-1840年,而最为湿润的阶段为1734-1761年间;赛里木流域历史降水存在3个极端湿润年(1749,1876和1924年)和4个极端干旱年(1714,1775,1847和1917年),1910年代为最干旱的十年;降水变化存在11-12a、3.0a、2.5a、2.1a和2.0a的变化准周期;赛里木湖流域过去373年的降水的阶段变化、周期变化和极端降水年份均与天山北坡中西部和中亚天山山区降水变化具有很好的一致性,本研究的降水重建序列能较好的代表天山北坡中西部和中亚大部分区域历史降水变化。