使用spark-1.4.1-bin-hadoop2.6进行处理,测试文件大小为3G,
测试结果:
1:统计一个文件中某个字符的个数
scala> sc.textFile("/home/y/my_temp/1.txt").filter(line=>line.contains("ok")).count()
scala> sc.textFile("/home/y/my_temp/1.txt"). 用时:Duration 13 s
记录条数:res5: Long = 101824020 2:统计行数
scala> sc.textFile("/home/y/my_temp/1.txt").count() 用时:Duration 12 s
记录条数:res2: Long = 10
相关文章
- LoadRunner测试结果分析03 转载至zhangzhe的新浪博客
- 本地测试html文件时CSS效果显示, 但是当django的服务器上运行时效果不显示
- chmod不起作用的原因分析 - Linux下查看分区文件系统类型
- 简单分析下mybatis中mapper文件中小知识
- Android APK 签名文件MANIFEST.MF、CERT.SF、CERT.RSA分析
- 【代码审计】CLTPHP_v5.5.3后台任意文件下载漏洞分析
- 动态链接库(Dynamic Link Library)学习笔记(附PE文件分析)
- PE文件学习系列笔记四-C++实现PE文件的分析
- INI配置文件分析小例子
- 【Android测试】【随笔】在手机里用命令行创建中文文件夹