OpenJDK 源码阅读之 Java 字节流输出类的实现
通过阅读 OpenJDK 源代码,描述了 Java IO 中,字节输出系列6个类的实现方式,并简单介绍了与压缩解压缩相关的几个类。
Java 的输入输出总是给人一种很混乱的感觉,要想把这个问题搞清楚,必须对各种与输入输出相关的类之间的关系有所了解。只有你了解了他们之间的关系,知道设计这个类的目的是什么,才能更从容的使用他们。
字节流输出
图1 Java 字节输出类
- OutputStream
OutputStream是所有字节输出类的超类,这是个抽象类,需要实现其中定义的 write
函数,才能有实用的功能。
其它方法都是在 write
的基础上实现的。例如这个多态的 write
:
- FileOutputStream
FileOutputStream
会将内容输出到 File
或者 FileDescriptor
, 此类是按照字节输出,如果想按照字符输出,可以使用FileReader
类。
构造器中,需要指明输出的文件:
写入操作是一个 native
函数,与操作系统相关。
如果对比一下字节输入类,你会发现输入和输出在实现上有很大的相似性,它们是对称的。
- ByteArrayOutputStream
ByteArrayOutputStream 会将数据写入字节数组中, 可以通过 toByteArray,toString
得到这些数据。
初始化时,可以指定这个数组的大小:
写入时,会写入这个数组。write
会先保证数组的大小,如果不够用,还会自动进行扩充。
- FilterOutputStream
所有有过滤功能的类的基类,例如,对输出流进行转化,或者添加新的功能。初始化时,需要提供一个底层的流,用于写入数据,FilterOUtputStream
类的所有方法都是通过调用这个底层流的方法实现的。
初始化时,
写入时:
- BufferedOutputStream
BufferedOutputStream 是 FilterOutputStream 的子类,提供缓冲功能,所以,你不用每写入一个字节都要调用操作系统的write
方法,而是积累到缓冲区,然后一起写入。
缓冲区就是一个字节数组,在构造器中被初始化。
当调用 write(b)
时,并不真正写入,而是将要写入的数据存放在缓冲区内,等缓冲区满后,一次性写入数据。
- DataOutputStream
DataOutputStream 可以按 Java 的基本类型写入数据。写入的原理是,将基本类型数据中的字节分离出来,然后将这些字节写入。例如:
boolean 类型就是按照 0/1
的方式写入的。
short 是两个字节,需要将其中的两个字节分离出来,分别写入,incCount
加了2. writeChar
同理,因为它也是写入两个字节。
浮点数比较特殊,没法直接分离出各个字节,要调用 Float
的一个静态方法,把浮点数转化成四个字节,再通过 writeInt
写入。floatToInitBits
会调用一个 native
方法, 按照 IEEE 754 标准,完成其主要功能。
- PipedOutputStream
管道输出流可以与一个管道输入流相关联,关联后,共用一个缓冲区,输出流写入数据,输入流读取数据,二者应该处于不同线程,否则可能出现死锁。
原理上一篇文章在介绍 PipedInputStream 时,已经阐述。
另外,我觉得在这里,有必要说一下那几个用于压缩和解压缩的类,实现就不说了,就讲下他们的功能与关系。
JAVA IO 压缩与解压缩
- InflaterInputStream: 用于解压 deflate 格式的压缩数据,底层流为压缩后的数据,read 返回解压后的数据。
- InflaterOutputStream: 用于解压 deflate 格式的压缩数据,底层流为压缩后的数据,write 写入解压后的数据。
- DeflaterInputStream: 用于压缩成 deflate 格式的数据,底层流为未压缩数据,read 返回压缩后的数据。
-
DeflaterOutputStream: 用于压缩成 deflate 格式的数据,底层流为未压缩数据,write 写入压缩后的数据。
-
GZIPInputStream: 用于解压 GZip 格式的压缩数据,底层流为压缩后的数据,read 返回解压后的数据。它是 InflaterInputStream 的子类。
- GZIPOutputStream: 用于压缩成 Gzip格式的数据,底层流为未压缩数据,write 写入压缩后的数据。是 DeflaterOutputStream 的子类(注意不是InflaterOutputStream) 。
不得不说,这个API设计的真是太反直觉了。GZIP 格式的解压和压缩一个是 GZIPInputStream,一个是 GZIPOutputStream。而 deflate 格式的解压和压缩,一个是 InflaterInputStream/InflaterOutputStream,另一个是 DeflaterInputStream/DeflaterOutputStream。当同时需要对 gzip 和 deflate 压缩和解压缩时,就感觉,真是反直觉。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)