文件名称:大数据可用性评价模型及分析综述
文件大小:1.74MB
文件格式:PDF
更新时间:2024-07-27 00:14:30
大数据模型算法
“大数据”已经成为计算机领域使用频率最高的专业词汇之一,而且已经逐渐变成了一个商品名称。无论是从学术研究角度,还是从数据交易需求甪度,对大数据集的可用性进行评价都是一个新的问题。文中提岀了一个大数据可用性评价模型,为学术和流通领域提供参考。结合大数据的4V( Volume, Variety,Ⅴ elocity, Value)特性,分段统计样本数据的4V特性分布,从而给出基于分段分布的大数据特性概率模型,以及大数据可用性加权评价模型。文中还提岀了实现大数据分块抽样的算法,以及大数据评价模型的各个特性加权系数的估计算法。结合视频大数据的可用性评价需求,展示所提模型和算法的具体应用。大数据可用性评价模型可以用于数据科学实验的数据评价,也可以用于大数据交易市场的数据集定价。给出了实际评价工作中,标准化(商品化)数据集以及确定数据评价基准等具体操作方面的解决方案。应用案例对所提模型有支持作用,进一步检验了模型的可行性。