前言

  • 转载请注明出处 ,来自:

暂时两篇:
(1) Android之间互相的录屏直播 –点对点传输(tcp长连接发送h264)(一)
http://blog.csdn.net/baidu_33546245/article/details/78670220
(2)Android之间互相的录屏相机直播-(增加声音直播)(二)
https://blog.csdn.net/baidu_33546245/article/details/80503091

  • 近期准备学习一些流媒体的资料.因此找到了来疯直播这个开源项目,研究了段时间,对来疯的代码架构佩服的五体投地.
  • 感谢来疯直播,先附上来疯直播的github地址

  • 于是在来疯直播的基础上,自己添加了一个利用tcp点对点推送的代码.. 因为只是个学习的demo,所以很多地方,只用了一些超简单的代码进行交互.

  • 这个只能算是一个初级demo. 延时基本在1s以内,只记录下自己学习的过程.偏向于学习.demo代码在文章最后.
    另外,本人才疏学浅,,如有各种理解错误,还望各位大神指出…

    图片角度有些问题,凑合看下吧

  • 把这个调研过程分为4部分,
    (1),简单的了解h264的数据结构.
    (2),学习来疯直播的代码,在来疯的架构上添加点对点传输代码.
    (3),tcp传输的交互过程.
    (4),实时播放h264数据.

    这里写图片描述

- 1,h264的数据结构

这里写图片描述

  • 1,关于sps和pps: 根据Android develop上的描述,简单概括:sps是序列参数集(Sequence Parametar
    Sets),pps是图片参数集(Picture Parametar Sets)

    参考:https://developer.android.google.cn/reference/android/media/MediaCodec.html

  • 2,关于IDR帧:

    • I帧:帧内编码帧是一种自带全部信息的独立帧,无需参考其它图像便可独立进行解码,视频序列中的第一个帧始终都是I帧.
      IDR帧: I和IDR帧都是使用帧内预测的。它们都是同一个东西而已,在编码和解码中为了方便,要首个I帧和其他I帧区别开,所以才把第一个首个I帧叫IDR,这样就方便控制编码和解码流程。
      IDR帧的作用是立刻刷新,使错误不致传播,从IDR帧开始,重新算一个新的序列开始编码。而I帧不具有随机访问的能力,这个功能是由IDR承担。

      总结:I帧就是一个记录了图片去全部信息的帧,而IDR帧不仅记录了图片的全部信息,而且播放器解析到IDR帧时会根据配置信息立刻刷新.比如直播过程中,当编码器的帧的长宽发生变化,如果中间没有IDR帧,播放器就会继续按错误的配置信息解码,从而不能正确的解析数据.

      参考:http://blog.csdn.net/jammg/article/details/52357245

  • 3,Android MediaCodec产生的h264数据
    经实际debug测试,Android产生的每一个nal是以(0x00,0x00,0x00,0x01)开头的,(有文章说 这是RTP
    格式的H264的特征,未能确定)..

    根据查询资料得知:
    Sps 开头【0x00, 0x00, 0x00, 0x01, 0x67】
    Pps 开头【0x00,0x00, 0x00, 0x01, 0x68】
    IDR 开头【0x00, 0x00, 0x00, 0x01,0x65】

    根据来疯直播中的判断条件得知:来疯中的KeyFrame 既指IDR帧.

   private boolean isKeyFrame(byte[] frame) {
        if (frame.length < 1) {
            return false;
        }
        // 5bits, 7.3.1 NAL unit syntax,
        // H.264-AVC-ISO_IEC_14496-10.pdf, page 44.
        //  7: SPS, 8: PPS, 5: I Frame, 1: P Frame
        int nal_unit_type = (frame[0] & 0x1f);
        return nal_unit_type == IDR;
    }

参考:https://www.cnblogs.com/lidabo/p/5384073.html

  • 4,我们需要的数据格式: 根据以上描述,我们可以得知,如果点对点传输H264的裸流的话,需要的数据格式如下:
    Sps + Pps + IDR + ……. + Sps + Pps + IDR + …

经过查看来疯打包flv的代码,我们做出如下修改…(手动把h264的头部给加回去,可能有更优的算法可以实现,也在学习研究…)

  private byte[] header = {0x00, 0x00, 0x00, 0x01};
    public void analyseVideoDataonlyH264(ByteBuffer bb, MediaCodec.BufferInfo bi) {
        bb.position(bi.offset);
        bb.limit(bi.offset + bi.size);
        ArrayList<byte[]> frames = new ArrayList<>();
        boolean isKeyFrame = false;

        while (bb.position() < bi.offset + bi.size) {
            byte[] frame = annexbDemux(bb, bi);
            if (frame == null) {
                SopCastLog.e(SopCastConstant.TAG, "annexb not match.");
                break;
            }
            // ignore the nalu type aud(9)
            if (isAccessUnitDelimiter(frame)) {
                continue;
            }
            // for pps
            if (isPps(frame)) {
                mPps = frame;
                continue;
            }
            // for sps
            if (isSps(frame)) {
                mSps = frame;
                continue;
            }
            // for IDR frame
            if (isKeyFrame(frame)) {
                isKeyFrame = true;
            } else {
                isKeyFrame = false;
            }
            frames.add(header);//本来是加flv的头,改为加h264的头
            frames.add(frame);
        }
        if (mPps != null && mSps != null && mListener != null && mUploadPpsSps) {
            if (mListener != null) {
                mListener.onSpsPps(mSps, mPps);
            }
            mUploadPpsSps = false;
        }
        if (frames.size() == 0 || mListener == null) {
            return;
        }
        int size = 0;
        for (int i = 0; i < frames.size(); i++) {
            byte[] frame = frames.get(i);
            size += frame.length;
        }
        byte[] data = new byte[size];
        int currentSize = 0;
        for (int i = 0; i < frames.size(); i++) {
            byte[] frame = frames.get(i);
            System.arraycopy(frame, 0, data, currentSize, frame.length);
            currentSize += frame.length;
        }
        if (mListener != null) {
            mListener.onVideo(data, isKeyFrame);
        }
    }

2,在来疯直播的基础上添加逻辑:

  1. 1,来疯直播执行流程:
    数据采集 -> 打包 ->进入缓存队列 ->发送
    看了流程,想必大家已经知道,我们需要修改,打包和发送两个环节.好在来疯的架构是特别好的,我们可以很方便的实现来疯的Packer和Sender接口,
    自定义逻辑来满足我们自己的需求.

  2. 2,实现TcpPacker,
    如果回调Sps,Pps则发送,
    如果回调的帧是IDR帧,则在前面加上Sps和Pps..

   @Override
    public void onSpsPps(byte[] sps, byte[] pps) {
        ByteBuffer byteBuffer = ByteBuffer.allocate(sps.length + pps.length + 8);
        byteBuffer.put(header);
        byteBuffer.put(sps);
        byteBuffer.put(header);
        byteBuffer.put(pps);
        mSpsPps = byteBuffer.array();
        packetListener.onSpsPps(mSpsPps);   // onSpsPps()回调没有参与发送逻辑,想要发送这些信息需要回调onPacket();
        packetListener.onPacket(mSpsPps, HEADER);
        isHeaderWrite = true;
    }
  @Override
    public void onVideo(byte[] video, boolean isKeyFrame) {
        if (packetListener == null || !isHeaderWrite) {
            return;
        }
        int packetType = INTER_FRAME;
        if (isKeyFrame) {
            isKeyFrameWrite = true;
            packetType = KEY_FRAME;
        }
        //确保第一帧是关键帧,避免一开始出现灰色模糊界面
        if (!isKeyFrameWrite) {
            return;
        }
        ByteBuffer bb;
        if (isKeyFrame) {
            bb = ByteBuffer.allocate(4 + video.length + mSpsPps.length);
            bb.put(mSpsPps);
            bb.put(video);
        } else {
            bb = ByteBuffer.allocate(4 + video.length );
            bb.put(video);
        }
        packetListener.onPacket(bb.array(), packetType);
    }

3,实现TcpSender:

  • 没有什么特别注意的,就是一个普通的Tcp连接

3,tcp传输:

  • 1,为了传输h264数据,我们需要在两个设备之间建立一个长连接,这里采用ServerSoket,为了确保数据在tcp建立成功后,才开始传输,我自定义了一个逻辑,当播放端初始化成功后,
    会给推送端发送一个OK的字符串,而推送端收到OK的字符串后,才会开启发送线程,进行发送数据(有点类似Rtmp的握手)

  • 2,为了保证播放的连贯性:
    我们在写某段字节前,会在这段字节前加上字节数组的长度,这样我们就可以保证,播放端每读到一帧数据,就可以立刻把数据写给播放代码..

public class EncodeV1 {     //`发送时加上byte数组长度
    private byte[] buff;    //要发送的某一帧的byte数组

    public EncodeV1(byte[] buff) {
        this.buff = buff;
    }

    public byte[] buildSendContent() {
        if (buff == null || buff.length == 0) {
            return null;
        }
        ByteBuffer bb = ByteBuffer.allocate(4 + buff.length);
        bb.put(ByteUtil.int2Bytes(buff.length));
        bb.put(buff);
        return bb.array();
    }
}
//在播放端读取时,先读4个字节获取某一帧的byte数组长度;再根据长度去读字节,值得注意的是一次read很可能读不完指定字节,需要根据已读到的字节长度去判断是否读完,如果没有读完,则需要再次去读指定字节,直到读够为止... readByte()方法就是处理这种情况的.
  while (startFlag) {            
        byte[] length = readByte(InputStream, 4);
         if (length.length == 0){
             continue;
        }
        int buffLength = bytesToInt(length);
        byte[] buff = readByte(InputStream, buffLength);
        listener.acceptBuff(buff);
   }
 private byte[] readByte(InputStream is, int readSize) throws IOException {
        byte[] buff = new byte[readSize];
        int len = 0;
        int eachLen = 0;
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        while (len < readSize) {
            eachLen = is.read(buff);
            if (eachLen != -1) {
                len += eachLen;
                baos.write(buff, 0, eachLen);
            } else {
                break;
            }
            if (len < readSize) {
                buff = new byte[readSize - len];
            }
        }
        byte[] b = baos.toByteArray();
        baos.close();
        return b;
    }

4,实时播放h264数据:

  • 1,我们首先在播放端建立代码结构,(思路如下)
    (1), Server去监听端口号 ->
    (2),建立长连接 ->
    (3),在长连接中根据我们在字节数组前加的标记去读取每一帧数据 ->
    (4),将数据放入到一个容器中,容器选择:ArrayBlockQueue,一个自带阻塞的队列,
 private ArrayBlockingQueue<byte[]> mPlayQueue;
    private String TAG = "NormalPlayQueue";
    private static final int NORMAL_FRAME_BUFFER_SIZE = 150; //缓存区大小

    public NormalPlayQueue() {
        mPlayQueue = new ArrayBlockingQueue<byte[]>(NORMAL_FRAME_BUFFER_SIZE, true);
    }


    public byte[] takeByte() {
        try {
            return mPlayQueue.take();
        } catch (InterruptedException e) {
            Log.e(TAG,"take bytes exception" + e.toString());
            return null;
        }
    }

    public void putByte(byte[] bytes) {
        try {
            mPlayQueue.put(bytes);
        } catch (InterruptedException e) {
            Log.e(TAG, "put bytes exception" + e.toString());
        }
    }

(5),遍历容器,将每一帧数据数据写入播放代码中..
播放逻辑参考这位大神的逻辑,修改了一下,每读到一个帧的byte数组,就把字节写进去播放..
原地址

最后

调用参考来疯直播的代码,直接创建出TcpPacker,TcpSender
然后把这两个设置给StreamController,

  private void startRecord() {
        TcpPacker packer = new TcpPacker();
//        FlvPacker flvPacker = new FlvPacker();
//        packer.initAudioParams(AudioConfiguration.DEFAULT_FREQUENCY, 16, false);
        mVideoConfiguration = new VideoConfiguration.Builder().build();
        setVideoConfiguration(mVideoConfiguration);
        setRecordPacker(packer);

        tcpSender = new TcpSender(ip, port);
        tcpSender.setSenderListener(this);
        tcpSender.setVideoParams(mVideoConfiguration);
        tcpSender.connect();
        LocalSender localSender = new LocalSender();
        setRecordSender(tcpSender);
        startRecording();
    }

最后附上发送端也就是数据采集端,和播放端demo的github地址:
数据采集端的地址
播放端的地址

需要注意一下:数据采集端要发送的ip写死在了代码里…

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐