8c88bfe647d4acf00df39b10d9557973.png

什么是Docker?

“Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。” ——百度词条

由百度词条的定义,我们可以捕捉到几个关键词,应用容器虚拟化沙箱。简单的说,容器就是用于存储的一个东西;虚拟化,就是将一台计算机虚拟成多台逻辑计算机;沙箱,是一个独立的工作环境,在内部的任何操作不会影响到外部。总结起来,docker能够生成一个个空间,每个空间内部装载了一些应用及其依赖包,空间之间互不影响,这些空间能够将计算机切分成若干个逻辑(虚拟)计算机。打个比方,docker类似集装箱,各式各样的货物,经过集装箱的标准化进行托管,集装箱与集装箱之间没有影响。本来docker公司就是设想,交付运行如同海运一般,以OS(操作系统)为货轮,进行集装箱运输。

37f0fcf79595dd7d3eeef5ba63975fe6.png

怎么样,听起来这个说法会不会很熟悉?是不是觉得和虚拟机很像?确实,docker和虚拟机的基本思想是一致的,都是通过打包,隔离等手段,将物理计算机分成若干个虚拟计算机,彼此之间相互影响。但是两者还是有区别的,了解两者的区别,有助于我们理解docker技术的优势。

1)计算机结构

10d1f2b318ced35bc6663f8f8bfef2f3.png

我们可以把计算机分成三层,最底下是硬件层,就是各种硬盘,cpu,电源等等设备的集合,议案也称为裸机;第二层是操作系统,操作系统可分成内核空间和用户空间,分别管理计算内部核心进程,系统文件管理,用户空间通过文件系统对其资源进行管理;第三层就是应用层,各类应用程序的集合体。

2)Docker VS 虚拟机

从计算机结构可以看出,如果想要得到多个计算机,最简单的方法就是将整个计算机的架构整体打包封装,让其在一个独立的环境下运行,从而实现虚拟化,这也是虚拟机的做法。如下图所示:

4fdd7cb27dae7094174f9e82a58e6a7c.png

显然,将整个计算机结构一起打包使得虚拟机过于庞大,占用过多资源(存储和计算),导致一部物理机器上能够部署的虚拟机数量很有限。那有没有其他方法吗?有!就是Docker技术。

虚拟机主要运行在应用程序层面,利用物理机上面的存储空间,和计算资源,隔离的比较彻底。而Docker则是直接运行在计算机的内核上面,依靠原计算机的硬件和操作系统,只对应用及其所需的依赖项进行打包,更加轻量化,如下所示。

edce94312ac99a294fcc30a596157152.png

Docker的容器只是包含应用和它的依赖项,作为一个独立的进程在主机操作系统上运行,和其他容器共享一个内核,相比虚拟机,更加“苗条”和高效。

3)Docker 和虚拟机总结

dc25b333236f05aa63f47cc3b43eb95a.png
  • Docker主要是对应用层进行封装打包,只包括应用程序的代码而其以来资源,因此占用空间比较小,而且能够作为独立进程在主机空间上运行,和其他容器共享操作系统内核,获得几近原生的性能。轻量化的结构带来了秒级的启动时间和大规模部署的可能性。
  • 虚拟机是针对硬件层进行打包,在此基础上,另外构建出操作系统和应用程序,体积较为庞大。由于主机不仅需要支持虚拟机内部应用程序的运行,还要分配资源构建虚拟硬件和操作系统,因此,虚拟机启动比较缓慢,一台物理机上能够部署的虚拟机也是很有限。

当然,虚拟机也不是毫无用处,它能够彻底隔离整个运行环境,一些底层的操作也不会影响到主机的运行,理智选择即可。

为什么使用Docker?

作为一种新兴的虚拟化方式,Docker 跟传统的虚拟化方式相比具有众多的优势。

1)更高效的利用系统资源

由于容器不需要进行硬件虚拟以及运行完整操作系统等额外开销,Docker对系统资源的利用率更高。无论是启动速度,应用执行速度、文件存储速度都比传统虚拟机技术更高效。

2)一致的运行环境

应用交接最怕听到”这个程序怎么在我电脑上就不行了?“这样的话。由于开发环境、测试环境、生产环境不一致,导致有些bug并未在开发过程中发现。而Docker的镜像提供了除内核外外完整的运行时环境,确保应用运行环境一致性。

3)持续交付和部署

对开发和运维人员来说,软件的部署是一个重要工作,如何顺利快捷地完成部署是他们所关心的。使用Docker可以通过定制应用镜像来实现持续集成、持续交付、部署。开发人员可以通过Dockerfile 来进行镜像构建,运维人员可以直接在生产环境中快速部署该镜像。

Docker架构

Docker使用C/S架构,client通过接口与Server进行通行实现容器的构建、运行和发布。cilent可以运行在同一台集群,也可以通过跨主机实现远程通信。

553b2083428b973a2179a35b16f84835.png

其中

  • client:Docker 客户端,调用Docker API,和Docker daemon进行通信。
  • Docker daemon:守护进程,接受并处理来自客户端的请求。
  • Contianer:容器
  • Image:镜像
  • registry:仓库集

Docker基础概念

Docker 包括三个基本概念

  • 镜像(Image)
  • 容器(Container)
  • 仓库(Repository)

理解了这三个概念,就理解了 Docker 的整个生命周期。

镜像:一个特殊的文件系统

由上文我们知道操作系统分为内核和用户空间,对于 Linux 而言,内核启动后,会挂载 root 文件系统为其提供用户空间支持。而 Docker 镜像(Image),就相当于是一个 root 文件系统。

Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。可以说,镜像是容器的基础。

镜像不包含任何动态数据,其内容在构建之后也不会被改变。也就是说,镜像是”read-only“的,这能够保证调用同个镜像得到的内容是一样的。

Docker 设计时,就充分利用 统一文件系统(union file system)技术,将其设计为分层存储的架构。 镜像实际是由多层文件系统联合组成,如下图所示。纵向上我们看到了多个只读层,它们重叠在一起。除了最下面一层,其它层都会有一个指针指向下一层。这些层是Docker内部的实现细节,并且能够在主机(译者注:运行Docker的机器)的文件系统上访问到。union FS技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在,在用户的角度看来(即箭头方向的视角),只存在一个文件系统。

225490e892b0a14cbc785b1508b95e74.png

镜像构建时,会一层层构建,前一层是后一层的基础。每一层构建完就不会再发生改变,后一层上的任何改变只发生在自己这一层(在构建过程中,处于编辑的一层相当于一个容器)。

比如,删除前一层文件的操作,实际不是真的删除前一层的文件,而是仅在当前层标记为该文件已删除。

在最终容器运行的时候,虽然不会看到这个文件,但是实际上该文件会一直跟随镜像。

因此,在构建镜像的时候,需要额外小心,每一层尽量只包含该层需要添加的东西,任何额外的东西应该在该层构建结束前清理掉。

分层存储的特征还使得镜像的复用、定制变的更为容易。甚至可以用之前构建好的镜像作为基础层,然后进一步添加新的层,以定制自己所需的内容,构建新的镜像。镜像的复用能够有效地减小存储空间。

237244534d776a236d31cbcde354aa5c.png
镜像复用和依赖

容器:镜像运行时的实体

镜像(Image)和容器(Container)的关系,就像是面向对象程序设计中的类和实例一样,镜像是静态的定义,容器是镜像运行时的实体。容器可以被创建、启动、停止、删除、暂停等 。

容器的实质是进程,但与直接在宿主执行的进程不同,容器进程运行于属于自己的独立的命名空间。前面讲过镜像使用的是分层存储,容器也是如此。

ce3c76571e3565faebb25d3df2b0d2df.png

容器存储层的生存周期和容器一样,容器消亡时,容器存储层也随之消亡。因此,任何保存于容器存储层的信息都会随容器删除而丢失。

按照 Docker 最佳实践的要求,容器不应该向其存储层内写入任何数据 ,容器存储层要保持无状态化。

所有的文件写入操作,都应该使用数据卷(Volume)、或者绑定宿主目录,在这些位置的读写会跳过容器存储层,直接对宿主(或网络存储)发生读写,其性能和稳定性更高。

数据卷的生存周期独立于容器,容器消亡,数据卷不会消亡。因此, 使用数据卷后,容器可以随意删除、重新 run,数据却不会丢失。

仓库:集中存放镜像文件的地方

镜像构建完成后,可以很容易的在当前宿主上运行,但是, 如果需要在其他服务器上使用这个镜像,我们就需要一个集中的存储、分发镜像的服务,Docker Registry 就是这样的服务。

一个 Docker Registry 中可以包含多个仓库(Repository);每个仓库可以包含多个标签(Tag);每个标签对应一个镜像。

所以说,镜像仓库是 Docker 用来集中存放镜像文件的地方,类似于我们之前常用的代码仓库。

通常,一个仓库会包含同一个软件不同版本的镜像,而标签就常用于对应该软件的各个版本 。

我们可以通过<仓库名>:<标签>的格式来指定具体是这个软件哪个版本的镜像。如果不给出标签,将以 latest 作为默认标签。

这里补充一下 Docker Registry 公开服务和私有 Docker Registry 的概念:

Docker Registry 公开服务是开放给用户使用、允许用户管理镜像的 Registry 服务。

一般这类公开服务允许用户免费上传、下载公开的镜像,并可能提供收费服务供用户管理私有镜像。

最常使用的 Registry 公开服务是官方的 Docker Hub ,这也是默认的 Registry,并拥有大量的高质量的官方镜像,网址为:http://hub.docker.com/ 。

在国内访问 Docker Hub 可能会比较慢,国内也有一些云服务商提供类似于 Docker Hub 的公开服务。

除了使用公开服务外,用户还可以在本地搭建私有 Docker Registry 。Docker 官方提供了 Docker Registry 镜像,可以直接使用做为私有 Registry 服务。

总结

本文介绍了Docker技术的一些基本的概念,指在让更多读者认识Docker技术的魅力和潜力,并不涉及具体Docker技术的实现和使用。Docker虽然说是一个技术,但其思想也是值得大家学习和品味,相信Docker技术在推动行业发展和改变方面具有相当的影响。目前谷歌、腾讯、微软、京东等,都引进Docker技术,变革正在进行,Docker技术有希望将整个互联网变成一个巨计算机,解决资源和服务割裂问题,推动云服务和资源共享向前发展。

参考文献:

https://github.com/yeasy/docker_practice​github.com
c7563b0c0ea49d06035fc93d3c45d8f6.png

yeasy/docker_practice

yeasy/docker_practice​github.com
c7563b0c0ea49d06035fc93d3c45d8f6.png
Docker_百度百科​baike.baidu.com
9484eab640737f7c992cf40f86d0cca3.png
https://blog.csdn.net/zl1zl2zl3/article/details/80847805​blog.csdn.net
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐