大数据的多样性-研究论文

时间:2024-06-29 08:55:42
【文件属性】:

文件名称:大数据的多样性-研究论文

文件大小:154KB

文件格式:PDF

更新时间:2024-06-29 08:55:42

big data ontology

大数据在文献中有不同的定义。 大体上,定义表明大数据是那些拥有一系列关键特征的数据:容量、速度和多样性(3V),但也包括穷举性、分辨率、索引性、相关性、扩展性和可扩展性。 然而,这些定义缺乏本体论的清晰度,该术语充当了广泛选择的数据的无定形、包罗万象的标签。 在本文中,我们考虑了“大数据,大数据是什么?”这个问题,将 Kitchin (2013, 2014) 的七个大数据特征分类法应用于来自七个领域的 26 个数据集,每个数据集在文献中都被认为构成大数据。 结果表明,只有少数数据集具备所有七个特征,有些数据集既不具备数量又不具备多样性。 相反,大数据有多种形式。 我们的分析表明,关键的定义边界标记是速度和穷尽性特征。 我们认为,大数据作为一个分析类别需要被解开,进一步划定大数据的种类并确定其各种物种。 只有通过这样的本体论工作,我们才能获得关于大数据构成的概念清晰,制定如何最好地理解它,并确定如何最好地利用它来理解世界。


网友评论