视频地址:http://pan.baidu.com/s/1dDEgKwD
第六课统讲了hadoop几个子项目和HBase,第七课还是讲的HBase
第八课讲了PIG
第九课讲了Hive和Zookeeper
第十课讲了sqoop
这一课还是比较受用,之前就一直疑问HDFS怎么和关系型数据库联系起来
原来有这样的组件
这几节讲的很笼统,也不实践,都是快进看的。
Linux whereis命令
http://www.jb51.net/os/RedHat/1103.html
MR的输出目录必须是不存在的
nosql不是 no sql
是 not only sql
1.HBase适于用比较成熟的额分析主题,即建表后查询语句和表不再更改的
2.HBase最近的数据在内存中,一定时间后才会写在HDFS中,所以查询有可能完全不用IO,速度很快
3.HBase的分布式是按行键范围分布的
linux set命令
视频看完了,应该算是入门了吧