学科分类
/ 25
500 个结果
  • 简介:摘要:最近出现的像物联网和大数据这样的尖端计算技术,导致了一个可以生成、收集和利用大规模数据的新时代。现在不仅可以更容易地获得数据量,而且还可以获得以前难以获得的信息和知识。在不同的领域,如能源、气候、经济、商业和医疗保健,由于数据采集故障、传输过程异常、机器运行中的设备故障等等原因,导致在这些领域往往存在数据部分缺失的问题。缺失的值被认为是数据分析中的主要障碍,因为它们扭曲了数据的统计特性,减少了可用性。缺失的值不仅会破坏原始数据分布的完整性和平衡性,而且还会影响相关场景的后续分析和应用,因此时间序列中缺失值的处理已经成为一个非常重要的问题,同时时间序列数据数据挖掘和分析中具有重要的价值。

  • 标签: 时间序列 缺失数据 数据填充
  • 简介:摘要:在现实环境中,往往需要进行各种数据统计,在数据统计调查中往往存在数据不全的情况。在各种情形下,数据缺失将对统计工作产生不利影响。因此,对于数据丢失的类型和原因,应采用不同的方法加以解决,只有这样才能保证统计调查的结果。基于此,本文重点论述了统计调查中的数据缺失及处理。

  • 标签: 统计调查 数据缺失 处理
  • 简介:摘要:本文基于伦理决策框架的相关理论,从后果论、义务论、正义论和德性论的视角分别分析了“大数据杀熟”中的商业伦理缺失问题。分析表明,“大数据杀熟”的背后,本质上其实是商业伦理的缺失,而这个现象最终损害的将是整个行业以及用户利益。本文的研究发现为扭转“大数据杀熟”困境,遏制“杀熟”乱象提供了实践建议。

  • 标签: 大数据杀熟 商业伦理
  • 简介:探讨hot-deck估算在含有缺失数据的配比设计资料分析中的应用。在Stata7.0软件上利用AdrianMander和DavidClayton开发的hot-deck程序进行数据模拟。结果,hot-deck估算可以使缺失数据所包含的信息得到一定程度的弥补,当含有缺失值的变量是分类或等级变量时,效果更为显著。

  • 标签: 缺失数据 估算 设计 配比 DAVID 数据模拟
  • 简介:经典粗糙集理论关注的是论域上的单个二元等价关系导出的集合的近似。将等价关系弱化为相似关系、相容关系或邻域关系等可得到多种拓展粗糙集模型。但以粒计算的观点来看,这些模型都是单粒度的。本文把单粒度的粗糙集模型推广到不完备信息系统中的多粒度粗糙集模型,用论域上的多个相容关系定义了集合的近似。研究了含有缺失数据的多粒度粗糙集模型的一些数学性质,定义了不完备环境下的多粒度粗糙集模型的近似精度,实例表明多粒度粗糙集模型比单粒度粗糙集模型具有更高的精度。

  • 标签: 粗糙集 多粒度 近似度量
  • 简介:摘要:电力市场改革在我国开展以后,准确的负荷预测对于电力市场需求分析具有重要意义,而采集、统计过程中的缺失数据直接影响着电力负荷预测等数据分析的精度,为此对基于用电负荷的缺失数据插补方法展开了研究。首先选取了典型工商业用户,生成用电负荷曲线,按照拟合曲线特征,对用户负荷曲线进行分类。然后随机生成了每个用户10%缺失率下的不完整数据集,并利用均值插补、回归插补和期望最大化插补方法补全缺失数据。最后对比了插补后数据集与原始数据集的数据情况,通过计算均方误差值比较并分析了插补效果。

  • 标签: 数据插补 负荷预测 均值插补
  • 简介:摘要:随着国家对生态环境数据监测标准的日益提高,当前地表水水质的分析可通过自动监测与手工监测两种方式进行,而每月一次的手工监测已难以满足国家对环境指标的需要,因此全天候自动化的监测方式可作为手工监测数据的补充,促进环境部门更为精准地了解水质情况。

  • 标签: 地表水水质分析 水质监测 数据对比 监测偏差
  • 简介:

  • 标签:
  • 简介:摘要目的数据缺失是队列研究中几乎无法避免的问题。本文旨在通过模拟研究,比较当前常见的8种缺失数据处理方法在纵向缺失数据中的填补效果,为纵向缺失数据的处理提供有价值的参考。方法模拟研究基于R语言编程实现,通过Monte Carlo方法产生纵向缺失数据,通过比较不同填补方法的平均绝对偏差、平均相对偏差和回归分析的Ⅰ类错误,评价不同填补方法对于纵向缺失数据的填补效果及对后续多因素分析的影响。结果均值填补、k近邻填补(KNN)、回归填补和随机森林的填补效果接近,且表现稳定;多重插补和热卡填充次于以上填补方法;K均值聚类和EM算法填补效果最差,表现也最不稳定。均值填补、EM算法、随机森林、KNN和回归填补可较好地控制Ⅰ类错误,多重插补、热卡填充和K均值聚类不能有效控制Ⅰ类错误。结论对于纵向缺失数据,在随机缺失机制下,均值填补、KNN、回归填补和随机森林均可作为较好的填补方法,当缺失比例不太大时,多重插补和热卡填充也表现较好,不推荐K均值聚类和EM算法。

  • 标签: 纵向数据 缺失数据 填补
  • 简介:摘要环境水质监测有利于改善我国水资源污染现状,人们监测环境水质的时候,会详细分析监测数据,提高监测质量,了解两大河系支流情况,针对水资源污染现状加以分析和处理。一旦水资源受到污染,将会从个别区域延伸到多个区域,强化环境水质监测力度,有利于保证水资源质量,环节资源污染现状,实现人与自然的和谐统一。

  • 标签: 环境水质分析 监测技术 数据处理
  • 简介:摘要:环境监测的主要内容就是水质分析,通过水质分析了解水环境情况,重视监测数据的分析处理,提高水环境监测质量。鉴于此,文中分析环境水质分析的重要性,探讨如何应用监测技术,提高监测数据处理质量的措施,提高环境保护质量。

  • 标签: 环境监测 水质分析 数据处理
  • 简介:摘要环境水质监测有利于改善我国水资源污染现状,人们监测环境水质的时候,会详细分析监测数据,提高监测质量,了解两大河系支流情况,针对水资源污染现状加以分析和处理。一旦水资源受到污染,将会从个别区域延伸到多个区域,强化环境水质监测力度,有利于保证水资源质量,环节资源污染现状,实现人与自然的和谐统一。

  • 标签: 环境水质分析 监测技术 数据处理
  • 简介:摘要本文结合工程实例,重点介绍了深基坑工程施工中变形监测设计的主要内容及方法,并针对监测数据进行分析,从而及时反映出深基坑支护结构的变形情况,确保施工的安全进行,以期能为有关方面的需要提供参考借鉴。

  • 标签: 深基坑工程 监测设计 数据分析
  • 简介:摘要:水是人类在地球上生存的重要来源。水资源与人们的生活息息相关。不光是人,任何生物都离不开水。为了减少水资源的污染,必须重视对水质的检测和管理,无论是提高水资源质量还是保护,效果都是显著的。在水资源利用中,要加强对区域水质的控制管理和监测,使我们对污染源和污染状况有详细、准确的了解,进而制定相应的措施,降低水资源的污染程度。

  • 标签: 水质监测技术 监测数据 处理分析