8 个解决方案
#1
就是海量数据,大数据到底有多大?一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……
http://baike.baidu.com/link?url=TEO8ZooKFOnLDvsPyDfXvasqSV6mogLRhyGwX2oIHSTaH-h8YC7b6qepZxx3PKMDtHLVhcXjzVEpKlKcDA2NMK
http://baike.baidu.com/link?url=TEO8ZooKFOnLDvsPyDfXvasqSV6mogLRhyGwX2oIHSTaH-h8YC7b6qepZxx3PKMDtHLVhcXjzVEpKlKcDA2NMK
#2
就是很大很大的数据
#3
大量数据、海量数据这些词儿听过吧?现在统称为大数据了。
因为随着系统的持续运行,用户数的持续增加,历史数据积累越来越大,以PB级别来计算了。怎么进行系统的优化查询,怎么进行数据的挖掘,都将面向新的状况。
因为随着系统的持续运行,用户数的持续增加,历史数据积累越来越大,以PB级别来计算了。怎么进行系统的优化查询,怎么进行数据的挖掘,都将面向新的状况。
#4
不知道可不可以这么理解“大数据”:
第一,数据量是海量的,海量到进行查询、统计分析必须使用并行计算技术才能很好地完成。
第二,数据是非结构化的、形式多样的。它目前不一定以一个数据库的形式存在。可能是分布在好多服务器上的一些数据文件、数据库、文档甚至图像、影音文件的集合。而且,还可能混杂着多种形式。
第三,这些数据本身并不直接体现价值。你需要对这些数据进行挖掘和分析才能得到想要的结果。通常,这个分析结果可能是一个统计上的、趋势上的结论。相关性分析、统计模型、线性的和非线性的机理模型可能是需要的工具。这些分析过程所用到的样本并不需要特别精确。例如分析顾客的消费行为,由于实时性等原因,少统计某一个用户对结果几乎毫无影响。
第四,貌似是对分析的时限有严格的要求(1秒定律)。例如,通过对气象数据的分析预测化工厂危险气体泄漏后的波及范围,这需要很快得到结论。这虽然不一定就是1秒,但的确对分析计算速度有很高的要求。
第一,数据量是海量的,海量到进行查询、统计分析必须使用并行计算技术才能很好地完成。
第二,数据是非结构化的、形式多样的。它目前不一定以一个数据库的形式存在。可能是分布在好多服务器上的一些数据文件、数据库、文档甚至图像、影音文件的集合。而且,还可能混杂着多种形式。
第三,这些数据本身并不直接体现价值。你需要对这些数据进行挖掘和分析才能得到想要的结果。通常,这个分析结果可能是一个统计上的、趋势上的结论。相关性分析、统计模型、线性的和非线性的机理模型可能是需要的工具。这些分析过程所用到的样本并不需要特别精确。例如分析顾客的消费行为,由于实时性等原因,少统计某一个用户对结果几乎毫无影响。
第四,貌似是对分析的时限有严格的要求(1秒定律)。例如,通过对气象数据的分析预测化工厂危险气体泄漏后的波及范围,这需要很快得到结论。这虽然不一定就是1秒,但的确对分析计算速度有很高的要求。
#5
以前,人们分析事物靠的是理论研究、学习。
而如今,有些人全靠海量收集别人的垃圾,然后让计算机帮自己照抄。
这就是大数据。
而如今,有些人全靠海量收集别人的垃圾,然后让计算机帮自己照抄。
这就是大数据。
#6
以前,我们把垃圾都倒掉。
而今天,有些人专门囤积大家的垃圾,舍不得扔掉。因为他们再也不相信智能,而是相信垃圾处理必定可以变废为宝。
于是就有一些专门研究如何囤积垃圾的公司发财了,因为白痴越来越多了。
而今天,有些人专门囤积大家的垃圾,舍不得扔掉。因为他们再也不相信智能,而是相信垃圾处理必定可以变废为宝。
于是就有一些专门研究如何囤积垃圾的公司发财了,因为白痴越来越多了。
#7
大数据不能望文生义是“很大的数据”,或者海量数据。
大数据主要是指围绕相同事物而得到的产生的复杂的数据——数据多只是其中之一,数据结构复杂、关系复杂、种类复杂、表现形式复杂、分析和处理的方式复杂,这才是大数据根本的特征。
大数据主要是指围绕相同事物而得到的产生的复杂的数据——数据多只是其中之一,数据结构复杂、关系复杂、种类复杂、表现形式复杂、分析和处理的方式复杂,这才是大数据根本的特征。
#8
4L的理解基本是正确的。
#1
就是海量数据,大数据到底有多大?一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……
http://baike.baidu.com/link?url=TEO8ZooKFOnLDvsPyDfXvasqSV6mogLRhyGwX2oIHSTaH-h8YC7b6qepZxx3PKMDtHLVhcXjzVEpKlKcDA2NMK
http://baike.baidu.com/link?url=TEO8ZooKFOnLDvsPyDfXvasqSV6mogLRhyGwX2oIHSTaH-h8YC7b6qepZxx3PKMDtHLVhcXjzVEpKlKcDA2NMK
#2
就是很大很大的数据
#3
大量数据、海量数据这些词儿听过吧?现在统称为大数据了。
因为随着系统的持续运行,用户数的持续增加,历史数据积累越来越大,以PB级别来计算了。怎么进行系统的优化查询,怎么进行数据的挖掘,都将面向新的状况。
因为随着系统的持续运行,用户数的持续增加,历史数据积累越来越大,以PB级别来计算了。怎么进行系统的优化查询,怎么进行数据的挖掘,都将面向新的状况。
#4
不知道可不可以这么理解“大数据”:
第一,数据量是海量的,海量到进行查询、统计分析必须使用并行计算技术才能很好地完成。
第二,数据是非结构化的、形式多样的。它目前不一定以一个数据库的形式存在。可能是分布在好多服务器上的一些数据文件、数据库、文档甚至图像、影音文件的集合。而且,还可能混杂着多种形式。
第三,这些数据本身并不直接体现价值。你需要对这些数据进行挖掘和分析才能得到想要的结果。通常,这个分析结果可能是一个统计上的、趋势上的结论。相关性分析、统计模型、线性的和非线性的机理模型可能是需要的工具。这些分析过程所用到的样本并不需要特别精确。例如分析顾客的消费行为,由于实时性等原因,少统计某一个用户对结果几乎毫无影响。
第四,貌似是对分析的时限有严格的要求(1秒定律)。例如,通过对气象数据的分析预测化工厂危险气体泄漏后的波及范围,这需要很快得到结论。这虽然不一定就是1秒,但的确对分析计算速度有很高的要求。
第一,数据量是海量的,海量到进行查询、统计分析必须使用并行计算技术才能很好地完成。
第二,数据是非结构化的、形式多样的。它目前不一定以一个数据库的形式存在。可能是分布在好多服务器上的一些数据文件、数据库、文档甚至图像、影音文件的集合。而且,还可能混杂着多种形式。
第三,这些数据本身并不直接体现价值。你需要对这些数据进行挖掘和分析才能得到想要的结果。通常,这个分析结果可能是一个统计上的、趋势上的结论。相关性分析、统计模型、线性的和非线性的机理模型可能是需要的工具。这些分析过程所用到的样本并不需要特别精确。例如分析顾客的消费行为,由于实时性等原因,少统计某一个用户对结果几乎毫无影响。
第四,貌似是对分析的时限有严格的要求(1秒定律)。例如,通过对气象数据的分析预测化工厂危险气体泄漏后的波及范围,这需要很快得到结论。这虽然不一定就是1秒,但的确对分析计算速度有很高的要求。
#5
以前,人们分析事物靠的是理论研究、学习。
而如今,有些人全靠海量收集别人的垃圾,然后让计算机帮自己照抄。
这就是大数据。
而如今,有些人全靠海量收集别人的垃圾,然后让计算机帮自己照抄。
这就是大数据。
#6
以前,我们把垃圾都倒掉。
而今天,有些人专门囤积大家的垃圾,舍不得扔掉。因为他们再也不相信智能,而是相信垃圾处理必定可以变废为宝。
于是就有一些专门研究如何囤积垃圾的公司发财了,因为白痴越来越多了。
而今天,有些人专门囤积大家的垃圾,舍不得扔掉。因为他们再也不相信智能,而是相信垃圾处理必定可以变废为宝。
于是就有一些专门研究如何囤积垃圾的公司发财了,因为白痴越来越多了。
#7
大数据不能望文生义是“很大的数据”,或者海量数据。
大数据主要是指围绕相同事物而得到的产生的复杂的数据——数据多只是其中之一,数据结构复杂、关系复杂、种类复杂、表现形式复杂、分析和处理的方式复杂,这才是大数据根本的特征。
大数据主要是指围绕相同事物而得到的产生的复杂的数据——数据多只是其中之一,数据结构复杂、关系复杂、种类复杂、表现形式复杂、分析和处理的方式复杂,这才是大数据根本的特征。
#8
4L的理解基本是正确的。