1. 本章学习总结
2. 书面作业
将Student对象(属性:int id, String name,int age,double grade)写入文件student.data、从文件读出显示。
Q1.字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)
1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号)
1.2 生成文件大小多少?分析该文件大小
num 1字节
name 4字节
age 2字节
score 4字节
分隔符 3字节
行末 2字节
- 所以字节数=3+16*3=51字节
1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么?
- 文件大小为0字节。因为读取不到数据,出现了NoSuchElementException,因为PrintWriter内部使用了缓冲区,数据被写到了缓冲区,println方法可以把缓冲区的数据写入到文件中,而close方法内部自动调用flush()来强制输出缓冲区的数据,但是如果没有close的话,数据就会在缓冲区里就丢失了。
Q2.缓冲流
2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间
- 由图可以看出使用BufferedReader读取数据比较快,因为BufferedReader使用了缓冲区,当要read时,先访问缓冲区,当缓冲区空了才真正的进行底层IO操作,这样减少了IO操作次数,虽然Scanner也有缓冲区,但BufferedReader缓冲区默认有8192字节(并且还可以更改大小)比Scanner大,所以就比较快。
2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因。
- 由上图可知,BufferedWriter写入文件的速度比较快,因为BufferedWriter内部也有缓冲区,当要进行写操作时,先访问缓冲区当缓冲区满了再进行IO操作。
Q3.字符编码
3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号)
- 由上图可知,出现了乱码。因为原EncodeTest文件是UTF-8编码格式,而eclipse默认使用GBK编码,所以当解码时就会出现乱码。
- 修改如下:
3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。
Q4.字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream
4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号)
4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么?
- 文件为76个字节。存储一个学生对象用24字节,所以文件大小=24*3+4=76字节,比题目1.1生成的文件大了。
num 4字节
name 6字节
age 4字节
grade 8字节
结束符 2字节
4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。
00 00 00 03 为三个student对象
00 00 00 01 为id=1
00 06 E5 BC A0 E4 B8 89 为name=张三
00 00 00 13 为age=19
40 50 40 00 00 00 00 00 为score=65.0
4.3 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) //参考ObjectStreamTest目录
Q5.Scanner基本概念组装对象
5.1 编写public static List
- BufferedReader提高读取效率,因为Student.txt是UTF-8编码格式,所以使用FileInputStream读取,搭配InputStreamReader将字节流->字符流。
- 组合过滤流方法可以为流额外增加功能!
Q6.选做:RandomAccessFile
6.1 使用RandomAccessFile实现题目1.1。(截图关键代码,出现学号)
6.2 分析文件大小
- 文件为76个字节。存储一个学生对象用24字节,所以文件大小=24*3+4=76字节。
num 4字节
name 6字节
age 4字节
grade 8字节
结束符 2字节
Q7.文件操作
编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
7.1 编写public static void findFile(String path,String filename)函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号)
7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1)?
7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。
7.4 选做:将指定目录及子目录下的所有.java文件,转化成UTF-8编码格式,并测试。
Q8.正则表达式
编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号)
8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串
8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="data:images/mail1.gif",然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。