1.概述
在这篇文章里, 我们将探索不同的方式从文件中读取数据。
首先, 学习通过标准的的Java类,从classpath、URL或者Jar中加载文件。
然后,学习通用BufferedReader, Scanner, StreamTokenizer, DataInputStream, SequenceInputStream, FileChannel读取文件内容。也会讨论如何读取UTF-8编码的文件。
最后,学习Java7和Java8中新的加载和读取文件的技术。
2.准备
2.1 输入文件
这篇文章的很多示例,从名为的文件读取文本内容,文件包含
Hello,World!
有少量示例, 我们会读取不同的文件, 示例中会有说明。
2.2 辅助方法
很多示例都会用到共用的方法readFromInputStream, 该方法将InputStream转化String
private String readFromInputStream(InputStream inputStream)
throws IOException {
StringBuilder resultStringBuilder = new StringBuilder();
try (BufferedReader br
= new BufferedReader(new InputStreamReader(inputStream))) {
String line;
while ((line = ()) != null) {
(line).append("\n");
}
}
return ();
}
3.从Classpath读取文件
3.1 使用标准Java
从src/main/resources读取文件
@Test
public void test() throws IOException {
String expectedData = "Hello,World!";
Class<ReadFileTest> clazz = ;
InputStream inputStream = ("/");
String data = readFromInputStream(inputStream);
(data, containsString(expectedData));
}
在上面的代码中,我们通过当前类的getResourceAsStream方法加载文件,入参是绝对路径。
ClassLoader中相同的方法也可以使用。
ClassLoader classLoader = getClass().getClassLoader();
InputStream inputStream = ("");
String data = readFromInputStream(inputStream);
这两种方法的主要区别是, 当前类的ClassLoader的getResourceAsStream方法,入参路径是从classpath开始。
而类实例的入参是相对于包路径,但路径开始使用'/'符号, 也是绝对路径。
特别要注意的是, 文件打开读取完数据后, 始终需要关闭
();
3.2 使用commons-io库
另一个比较常用的方法是使用commons-io包里的方法。
<dependency>
<groupId>commons-io</groupId>
<artifactId>commons-io</artifactId>
<version>1.4</version>
</dependency>
@Test
public void useCommonIO() throws IOException {
String expectedData = "Hello,World!";
ClassLoader classLoader = getClass().getClassLoader();
File file = new File(("").getFile());
String data = (file, "UTF-8");
assertEquals(expectedData, ());
}
该方法入参是File对象。这个工具类的优点是不用编码InputStream实例的相关代码。
这个库还提供了IOUtils类。
@Test
public void useCommonIO2() throws IOException {
String expectedData = "Hello,World!";
FileInputStream fis = new FileInputStream("src/test/resources/");
String data = (fis, "UTF-8");
assertEquals(expectedData, ());
}
@Test
public void bufferedReader() throws IOException {
String expected_value = "Hello,World!";
String file ="src/test/resources/";
BufferedReader reader = new BufferedReader(new FileReader(file));
String currentLine = ();
();
assertEquals(expected_value, currentLine);
}
当读取结束的时候, ()会返回null
NIO
NIO是在JDK7中添加。
5.1读取小文件
首先看一下关于的示例
@Test
public void readSmallFile() throws IOException {
String expected_value = "Hello,World!";
Path path = ("src/test/resources/");
String read = (path).get(0);
assertEquals(expected_value, read);
}
入参Path对象,Path可以认为是的升级版本,提供一些额外的功能。
如果读取的是二进制文件,可以使用()方法
5.2读取大文件
如果想要读取大文件, 我们可以使用Files类和BufferedReader类。
@Test
public void readLargeFile() throws IOException {
String expected_value = "Hello,World!";
Path path = ("src/test/resources/");
BufferedReader reader = (path);
String line = ();
assertEquals(expected_value, line);
}
5.
在JDK8中,Files类增加了lines方法,这个方法将返回Stream<String>。跟文件操作一样,Stream需要显式调用的close()。Files API提供了很多简单读取文件的方法。
下面我们将使用Scanner读取文件,使用逗号(,)作为定界符(delimiter)。
@Test
public void whenReadWithScanner_thenCorrect()
throws IOException {
String file = "src/test/resources/";
Scanner scanner = new Scanner(new File(file));
(",");
assertTrue(());
assertEquals("Hello", ());
assertEquals("World!", ());
();
}
Scanner默认的定界符是空格。它适用于从控制台读取输入或者内容有固定定界符的内容时。
tokenizer会指出下一个token的类型,String或Number。
- 如果类型为Number时,读取该字段
- 如果类型为String时,读取该字段
@Test
public void readWithTokenize()
throws IOException {
String file = "src/test/resources/";
FileReader reader = new FileReader(file);
StreamTokenizer tokenizer = new StreamTokenizer(reader);
// 1
();
assertEquals(StreamTokenizer.TT_WORD, );
assertEquals("Hello", );
// 2
();
assertEquals(StreamTokenizer.TT_NUMBER, );
assertEquals(1, , 0.0000001);
// 3
();
assertEquals(StreamTokenizer.TT_EOF, );
();
}
如果要读取二进制文件或者原生数据,可以使用DataInputStream
@Test
public void whenReadWithDataInputStream() throws IOException {
String expectedValue = "Hello,World!";
String file ="src/test/resources/";
String result = null;
DataInputStream reader = new DataInputStream(new FileInputStream(file));
int nBytesToRead = ();
if(nBytesToRead > 0) {
byte[] bytes = new byte[nBytesToRead];
(bytes);
result = new String(bytes);
}
assertEquals(expectedValue, result);
}
package ;
import ;
import ;
import ;
public class ccs_2 {
public static void main(String[] args) throws IOException {
String expectedValue = "";
String file = "C:\\Users\\Administrator\\Desktop\\";
//result = null;
DataInputStream reader = new DataInputStream(new FileInputStream(file));
int nBytesToRead = ();
if (nBytesToRead > 0) {
byte[] bytes = new byte[nBytesToRead];
(bytes);
expectedValue = new String(bytes);
}
("\n====" + expectedValue);
}
}
如果读取的是一个大文件,FileChannel速度会超过standard IO。
@Test
public void whenReadWithFileChannel()
throws IOException {
String expected_value = "Hello,World!";
String file = "src/test/resources/";
RandomAccessFile reader = new RandomAccessFile(file, "r");
FileChannel channel = ();
int bufferSize = 1024;
if (bufferSize > ()) {
bufferSize = (int) ();
}
ByteBuffer buff = (bufferSize);
(buff);
();
assertEquals(expected_value, new String(()));
();
();
}
package ;
import ;
import ;
import ;
import ;
public class ccs_2 {
public static void main(String[] args) throws IOException {
//throws IOException {
String expected_value = "";
String file = "C:\\Users\\Administrator\\Desktop\\";
RandomAccessFile reader = new RandomAccessFile(file, "r");
FileChannel channel = ();
int bufferSize = 1024;
if (bufferSize > ()) {
bufferSize = (int) ();
}
//}
ByteBuffer buff = (bufferSize);
(buff);
();
expected_value = new String(());
//assertEquals(expected_value, new String(()));
();
();
("\n====" + expected_value);
}
}
10.读取utf-8编码的文件
@Test
public void whenReadUTFEncodedFile()
throws IOException {
String expected_value = "你好,世界!";
String file = "src/test/resources/";
BufferedReader reader = new BufferedReader
(new InputStreamReader(new FileInputStream(file), "UTF-8"));
String currentLine = ();
();
assertEquals(expected_value, currentLine);
}
package ;
import ;
import ;
import ;
import ;
public class ccs_2 {
public static void main(String[] args) throws IOException {
// File file = new File("C:\\Program Files");
//
// //(());
// String[] A = ();
// for (int i = 0; i < ; i++) {
// ("\n=====" + A[i]);
// }
String expected_value = "你好,世界!";
String file = "C:\\Users\\Administrator\\Desktop\\";
BufferedReader reader = new BufferedReader
(new InputStreamReader(new FileInputStream(file), "UTF-8"));
String currentLine = ();
();
("\n====" + currentLine);
}
}
11.从URL读取数据
@Test
public void readFromURL() throws IOException {
URL urlObject = new URL("");
URLConnection urlConnection = ();
InputStream inputStream = ();
String data = readFromInputStream(inputStream);
}
12.从jar包中读取文件
我们的目标是读取junit-4.包中的文件。clazz只需要这个Jar中的类就行。
@Test
public void readFromJar() throws IOException {
String expectedData = "Eclipse Public License";
Class clazz = ;
InputStream inputStream = ("/");
String data = readFromInputStream(inputStream);
(data, containsString(expectedData));
}