OpenJDK 源码阅读之 Java 字节流输出类的实现

通过阅读 OpenJDK 源代码，描述了 Java IO 中，字节输出系列6个类的实现方式，并简单介绍了与压缩解压缩相关的几个类。

on_1y

2828人浏览 · 2014-07-12 20:00:27

on_1y · 2014-07-12 20:00:27 发布

Java 的输入输出总是给人一种很混乱的感觉，要想把这个问题搞清楚，必须对各种与输入输出相关的类之间的关系有所了解。只有你了解了他们之间的关系，知道设计这个类的目的是什么，才能更从容的使用他们。

这是这个系列的第二篇，描述字节输出类的实现，第一篇见：OpenJDK 源码阅读之 Java 字节流输入类的实现

字节流输出

图1 Java 字节输出类

OutputStream

OutputStream是所有字节输出类的超类，这是个抽象类，需要实现其中定义的 write 函数，才能有实用的功能。

    public abstract void write(int b) throws IOException;

其它方法都是在 write 的基础上实现的。例如这个多态的　write ：

public void write(byte b[], int off, int len) 
throws IOException {
    if (b == null) {
        throw new NullPointerException();
    } else if ((off < 0) || (off > b.length) || (len < 0) ||
               ((off + len) > b.length) || ((off + len) < 0)) {
        throw new IndexOutOfBoundsException();
    } else if (len == 0) {
        return;
    }
    for (int i = 0 ; i < len ; i++) {
        write(b[off + i]);
    }
}

FileOutputStream

FileOutputStream 会将内容输出到 File 或者 FileDescriptor，此类是按照字节输出，如果想按照字符输出，可以使用FileReader 类。

构造器中，需要指明输出的文件：

public FileOutputStream(File file, boolean append)
    throws FileNotFoundException
{
    String name = (file != null ? file.getPath() : null);
    SecurityManager security = System.getSecurityManager();
    if (security != null) {
        security.checkWrite(name);
    }
    if (name == null) {
        throw new NullPointerException();
    }
    this.fd = new FileDescriptor();
    this.append = append;

    fd.incrementAndGetUseCount();
    open(name, append);
}

写入操作是一个　native 函数，与操作系统相关。

private native void write(int b, boolean append) throws IOException;

如果对比一下字节输入类，你会发现输入和输出在实现上有很大的相似性，它们是对称的。

ByteArrayOutputStream

ByteArrayOutputStream　会将数据写入字节数组中, 可以通过 toByteArray,toString 得到这些数据。

protected byte buf[];

初始化时，可以指定这个数组的大小：

public ByteArrayOutputStream(int size) {
    if (size < 0) {
        throw new IllegalArgumentException("Negative initial size: "
                                           + size);
    }
    buf = new byte[size];
}

写入时，会写入这个数组。write 会先保证数组的大小，如果不够用，还会自动进行扩充。

public synchronized void write(int b) {
    ensureCapacity(count + 1);
    buf[count] = (byte) b;
    count += 1;
}

FilterOutputStream

所有有过滤功能的类的基类，例如，对输出流进行转化，或者添加新的功能。初始化时，需要提供一个底层的流，用于写入数据，FilterOUtputStream 类的所有方法都是通过调用这个底层流的方法实现的。

初始化时，

protected OutputStream out;
public FilterOutputStream(OutputStream out) {
    this.out = out;
}

写入时：

public void write(int b) throws IOException {
    out.write(b);
}

BufferedOutputStream

BufferedOutputStream 是 FilterOutputStream 的子类，提供缓冲功能，所以，你不用每写入一个字节都要调用操作系统的write 方法，而是积累到缓冲区，然后一起写入。

缓冲区就是一个字节数组，在构造器中被初始化。

protected byte buf[];

public BufferedOutputStream(OutputStream out) {
    this(out, 8192);
}

public BufferedOutputStream(OutputStream out, int size) {
    super(out);
    if (size <= 0) {
        throw new IllegalArgumentException("Buffer size <= 0");
    }
    buf = new byte[size];
}

当调用 write(b) 时，并不真正写入，而是将要写入的数据存放在缓冲区内，等缓冲区满后，一次性写入数据。

public synchronized void write(int b) throws IOException {
    if (count >= buf.length) {
        flushBuffer();
    }
    buf[count++] = (byte)b;
}

DataOutputStream

DataOutputStream 可以按 Java 的基本类型写入数据。写入的原理是，将基本类型数据中的字节分离出来，然后将这些字节写入。例如：

public final void writeBoolean(boolean v) throws IOException {
    out.write(v ? 1 : 0);
    incCount(1);
}

boolean 类型就是按照 0/1 的方式写入的。

public final void writeShort(int v) throws IOException {
    out.write((v >>> 8) & 0xFF);
    out.write((v >>> 0) & 0xFF);
    incCount(2);
}

short 是两个字节，需要将其中的两个字节分离出来，分别写入，incCount 加了2. writeChar 同理，因为它也是写入两个字节。

浮点数比较特殊，没法直接分离出各个字节，要调用 Float 的一个静态方法，把浮点数转化成四个字节，再通过 writeInt 写入。floatToInitBits 会调用一个 native 方法, 按照 IEEE 754 标准，完成其主要功能。

    public final void writeFloat(float v) throws IOException {
        writeInt(Float.floatToIntBits(v));
    }

PipedOutputStream

管道输出流可以与一个管道输入流相关联，关联后，共用一个缓冲区，输出流写入数据，输入流读取数据，二者应该处于不同线程，否则可能出现死锁。

原理上一篇文章在介绍 PipedInputStream 时，已经阐述。

另外，我觉得在这里，有必要说一下那几个用于压缩和解压缩的类，实现就不说了，就讲下他们的功能与关系。

JAVA IO 压缩与解压缩

InflaterInputStream: 用于解压 deflate 格式的压缩数据，底层流为压缩后的数据，read 返回解压后的数据。
InflaterOutputStream: 用于解压 deflate 格式的压缩数据，底层流为压缩后的数据，write 写入解压后的数据。
DeflaterInputStream: 用于压缩成 deflate 格式的数据，底层流为未压缩数据，read 返回压缩后的数据。
DeflaterOutputStream: 用于压缩成 deflate 格式的数据，底层流为未压缩数据，write 写入压缩后的数据。
GZIPInputStream: 用于解压 GZip 格式的压缩数据，底层流为压缩后的数据，read 返回解压后的数据。它是 InflaterInputStream 的子类。
GZIPOutputStream: 用于压缩成 Gzip格式的数据，底层流为未压缩数据，write 写入压缩后的数据。是 DeflaterOutputStream 的子类(注意不是InflaterOutputStream) 。

不得不说，这个API设计的真是太反直觉了。GZIP 格式的解压和压缩一个是 GZIPInputStream，一个是 GZIPOutputStream。而 deflate 格式的解压和压缩，一个是 InflaterInputStream/InflaterOutputStream，另一个是 DeflaterInputStream/DeflaterOutputStream。当同时需要对 gzip 和 deflate 压缩和解压缩时，就感觉，真是反直觉。

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

以智能致世界 | 操作系统大会2024议程全览