简介:摘要:随着电网终端采集装置的大范围安装与现场应用,越来越多的电网业务应用具备了数据实时采集的能力。为了充分发挥实时采集的电网数据价值,要求技术发展能够适应大规模电网数据流实时处理的新要求。然而,当前电力大数据的处理方式仍以传统的数据批处理为主,而大规模电网数据流在实时性、无序性、无限性、易失性、突发性等方面均呈现出了诸多新特征,使得基于“先存储后处理”设计理念的数据批量处理在可伸缩性、系统容错、状态一致性、负载均衡、数据吞吐量等方面面临着前所未有的新的挑战。类似于MapReduce的离线处理并不能很好地解决问题,而流计算可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息。
简介:【摘要】近年来关于限价指令簿和指令驱动市场的研究成为理论界与实务界共同关注的一个问题。由于在指令驱动市场中投资者的行动空间、状态空间以及决策时点的维度都大大增加,研究难度也大大提高,该领域的研究在国外尚处于起步阶段,在国内则几近空白。早期的静态均衡模型研究的重点主要在于描绘加总的LOB形状,以及不同市场机制的比较。近年来很多学者将外生决定的指令选择这一假设修改为内生决定的指令选择,从而将LOB的理论研究从静态均衡模型推向了动态均衡模型。LB的实证研究则主要包括指令簿和指令流的特征分析、指令的激进性、指令的不衡、指令簿的信息内涵以及指令簿透明度与市场质量等方面。但相对于指令驱动市场目前在全球证券交易中所占的绝对重要地位而言,关于指令簿和指令驱动市场的研究仍处于起步阶段,有待于进一步深入拓展。
简介:摘要目的构建自噬基因表达特征的肝细胞癌(hepatocellular carcinoma, HCC)患者预后的预测模型。方法从癌症基因组图谱(The Cancer Genome Atlas, TCGA)、基因型-组织表达研究项目(The Genotype-Tissue Expression, GTEx)数据库中分别得到所有HCC和正常肝细胞组织的基因转录表达数据,并将每个样本的基因转录表达数据统一转化为log2(FPKM值+1),消除数据库之间测试平台的数据差异。根据人类自噬基因库中获取的人类自噬基因列表筛选出TCGA-GTEx整合后序列中每个样本对应的自噬基因的表达量。采用R语言limma包以错误发现率(FDR)<0.05及差异倍数|logFC|>1为筛选标准,进行自噬基因差异表达分析。采用R语言clusterProfiler包对差异表达自噬基因以P<0.05为筛选标准,进行基因本体论(Gene Ontology,GO)富集分析及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析。根据自噬基因的差异表达量和患者的临床信息,采用R语言survival包进行单因素的Cox回归分析。进一步将单因素的Cox回归分析中有统计学意义(P<0.05)的自噬基因纳入到多因素Cox回归分析中,以每个差异表达的自噬基因表达量和相对应的回归系数coef值为基础,构建HCC的自噬基因预后模型:expmRNA1×βmRNA1+expmRNA2×βmRNA2+…+expmRNAn×βmRNAn(exp:基因表达量;β:多因素Cox回归分析的回归系数coef)。绘制预测模型的受试者工作特征(receiver operating characteristic,ROC)曲线并计算ROC曲线下面积(area under curve,AUC)评估模型预测价值。结果从TCGA-GTEx数据库中共得到HCC样本374例和正常肝组织样本160例的基因转录表达数据及临床信息。从整合后的样本序列中共筛选出205个自噬基因的表达数据,其中SPNS1、DIRAS3、TMEM74、NRG2、NRG1、IRGM、IKBKE、NKX2-3、BIRC5、CDKN2A、TP73为符合筛选标准的差异表达自噬基因。差异表达自噬基因GO主要富集在丝氨酸/苏氨酸蛋白激酶活性的调控、ErbB 2信号通路、蛋白激酶调节活性、激酶调节活性等功能。差异表达自噬基因主要富集在EGFR酪氨酸激酶抑制剂耐药、Hippo信号通路等KEGG通路。整合并删除生存信息缺失的样本后,共418例样本表达纳入到Cox回归分析中。通过单因素、多因素Cox风险回归分析后,筛选出NRG1(HR=1.5565,95%CI:1.1793~2.0543)、IKBKE(HR=1.7502, 95%CI:1.2093~2.5330)这两个自噬基因并建立预后预测模型:(0.44247×NRG1的表达量)+(0.55977×IKBKE的表达量)。预测模型的ROC曲线显示7年总体生存的AUC为0.711。结论基于NRG1和IKBKE表达量构建的HCC预后模型,对HCC患者远期生存率有较高的预测价值。