简介:摘要目的分析我国肝癌疾病负担。方法基于《中国肿瘤登记年报》、全国三次死因回顾性调查、《中国卫生健康统计年鉴》、《中国死因监测数据集》、GLOBOCAN、五大洲癌症发病率(CI5)、WHO死亡数据库、全球疾病负担项目(GBD)国内外8个数据源,摘录我国人群肝癌的发病、死亡和伤残调整生命年(DALY)等信息,分析肝癌疾病负担既往、现况及预期。结果①既往:CI5 1973-2012年的长期数据显示,我国城市(以上海市为例)男、女性肝癌发病率分别下降41.3%和36.3%,农村(以启东市为例)分别下降了32.3%和12.2%;近10年年报也显示2005-2015年全国发病和死亡率分别下降8.1%和12.8%;基于年鉴数据的Joinpoint分析也提示下降:2002-2017年全国死亡率平均年度变化百分比为-3.0%(P<0.05)。②现况:GLOBOCAN估计2018年我国肝癌发病率、死亡率和1年患病率分别为18.3/10万、17.1/10万和10.8/10万;最新年报显示,2015年肿瘤登记地区发病和死亡率分别为17.6/10万和15.3/10万,且均随年龄上升;监测数据报道2017年全国死亡率与之接近(16.7/10万),男女死亡比为3.1。GBD报道2017年我国肝癌所致DALY达1 115.3万人年,占全球的53.7%,HBV感染始终居归因首位。③预测:GLOBOCAN 2018预测至2040年我国肝癌发病和死亡例数将分别达到59.1万例和57.2万例,分别比2018年增加50.5%和54.9%,>70岁人群增幅明显。④经济负担:相关文献汇总显示,基于个体的研究报道的例均直接医疗费用呈上升趋势。结论多数据源均显示,我国人群肝癌发病和死亡率在数十年间有所下降,提示人群干预的有效性;但人群负担依然沉重,应继续加强优化一、二级预防为主的综合干预策略。
简介:摘要:随着电网终端采集装置的大范围安装与现场应用,越来越多的电网业务应用具备了数据实时采集的能力。为了充分发挥实时采集的电网数据价值,要求技术发展能够适应大规模电网数据流实时处理的新要求。然而,当前电力大数据的处理方式仍以传统的数据批处理为主,而大规模电网数据流在实时性、无序性、无限性、易失性、突发性等方面均呈现出了诸多新特征,使得基于“先存储后处理”设计理念的数据批量处理在可伸缩性、系统容错、状态一致性、负载均衡、数据吞吐量等方面面临着前所未有的新的挑战。类似于MapReduce的离线处理并不能很好地解决问题,而流计算可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息。
简介:摘要目的构建自噬基因表达特征的肝细胞癌(hepatocellular carcinoma, HCC)患者预后的预测模型。方法从癌症基因组图谱(The Cancer Genome Atlas, TCGA)、基因型-组织表达研究项目(The Genotype-Tissue Expression, GTEx)数据库中分别得到所有HCC和正常肝细胞组织的基因转录表达数据,并将每个样本的基因转录表达数据统一转化为log2(FPKM值+1),消除数据库之间测试平台的数据差异。根据人类自噬基因库中获取的人类自噬基因列表筛选出TCGA-GTEx整合后序列中每个样本对应的自噬基因的表达量。采用R语言limma包以错误发现率(FDR)<0.05及差异倍数|logFC|>1为筛选标准,进行自噬基因差异表达分析。采用R语言clusterProfiler包对差异表达自噬基因以P<0.05为筛选标准,进行基因本体论(Gene Ontology,GO)富集分析及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析。根据自噬基因的差异表达量和患者的临床信息,采用R语言survival包进行单因素的Cox回归分析。进一步将单因素的Cox回归分析中有统计学意义(P<0.05)的自噬基因纳入到多因素Cox回归分析中,以每个差异表达的自噬基因表达量和相对应的回归系数coef值为基础,构建HCC的自噬基因预后模型:expmRNA1×βmRNA1+expmRNA2×βmRNA2+…+expmRNAn×βmRNAn(exp:基因表达量;β:多因素Cox回归分析的回归系数coef)。绘制预测模型的受试者工作特征(receiver operating characteristic,ROC)曲线并计算ROC曲线下面积(area under curve,AUC)评估模型预测价值。结果从TCGA-GTEx数据库中共得到HCC样本374例和正常肝组织样本160例的基因转录表达数据及临床信息。从整合后的样本序列中共筛选出205个自噬基因的表达数据,其中SPNS1、DIRAS3、TMEM74、NRG2、NRG1、IRGM、IKBKE、NKX2-3、BIRC5、CDKN2A、TP73为符合筛选标准的差异表达自噬基因。差异表达自噬基因GO主要富集在丝氨酸/苏氨酸蛋白激酶活性的调控、ErbB 2信号通路、蛋白激酶调节活性、激酶调节活性等功能。差异表达自噬基因主要富集在EGFR酪氨酸激酶抑制剂耐药、Hippo信号通路等KEGG通路。整合并删除生存信息缺失的样本后,共418例样本表达纳入到Cox回归分析中。通过单因素、多因素Cox风险回归分析后,筛选出NRG1(HR=1.5565,95%CI:1.1793~2.0543)、IKBKE(HR=1.7502, 95%CI:1.2093~2.5330)这两个自噬基因并建立预后预测模型:(0.44247×NRG1的表达量)+(0.55977×IKBKE的表达量)。预测模型的ROC曲线显示7年总体生存的AUC为0.711。结论基于NRG1和IKBKE表达量构建的HCC预后模型,对HCC患者远期生存率有较高的预测价值。
简介:在这篇论文中,我们推荐一种名为广义主分量分析(GPCA)的多变量统计方法,该方法在减少有意义变量数量的同时,计算描述几组变量之间关系的分量并且也分别描述每一组变量的分量。GPCA适用于(根据一个真实地震数据集)等方位角数据体的联合地层反演之后得到的三个弹性参数(纵、横波阻抗和密度)。从GPCA提取的分量是在储层时窗描述地震特征的新的属性。这些新属性用来提取初始参数并在地质上用一种监控模式识别算法进行解释。新属性显得比(适用于相同数据)从一种主分量分析(PCA)提取的多种常规属性更为切合。第一,这些新属性能容易地显示出与几组变量的关系,因此在物理上能作解释。其二,根据更严格限制属性数量这一种手段,更好地提取这三个弹性参数。最后,利用从GPCA提取的属性,使所作的地质解释更可靠和更贴近实际。
简介:摘要:andriod OS在手机等消费电子终端设备领域得到普遍应用,通过设备下载大量的应用,同时设备上存储了大量的应用数据。存在着一个挑战是用户如何快速查找到设备上的信息或关键数据,本文介绍了传统的使用数据库进行数据管理的缺陷,并介绍一种基于开源搜索引擎的通用性框架,并根据多应用数据管理的一种通用性接口设计思路,各类应用根据本搜方案提供的方法进行搜索内容的限定,可确保应用数据的安全,同时可以提升搜索的精度。因为本方案是基于andriod操作系统的实际应用方案,对于使用andriod的各类设备支撑搜索功能具有参考意义。