COW机制

Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。

如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。

image-1660188855601

对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。

而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。

什么是存储卷

存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。

image-1660188867867

在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。

使用存储卷的好处

如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。

我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。

Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。

这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。

为什么要用存储卷

关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。

因此Docker存在的问题有:

  • 存储于联合挂载文件系统中,不易于宿主机访问
  • 容器间数据共享不便
  • 删除容器其数据会丢失

而要解决这些问题,解决方案就是使用存储卷。

存储卷管理方式

存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。

Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。

存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。

卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。

image-1660188885327

存储卷的分类

Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:

​ Bind mount volume

​ 指向主机文件系统上用户指定位置的卷

​ Docker-managed volume

​ Docker守护进程在Docker拥有的主机文件系统的一部分中创建托管卷

image-1660188901304

容器数据管理

用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。

容器中管理数据主要有两种方式:

  • 数据卷(Data Volumes)
  • 数据卷容器(Data Volumes Containers)

容器Volume使用语法:
Docker-managed volume

docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME

Bind mount volume

docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME

在容器中使用数据卷

在容器内创建一个数据卷

下面使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/du目录下:

[root@localhost ~]# docker run -d -P --name web -v /du nginx
c5ac3332cb40eeb12ec22064ec849a112b278b5b0bb69a229ea4e13531fd58a5
[root@localhost ~]# docker exec -it web /bin/bash
root@c5ac3332cb40:/# ls
bin   dev                  docker-entrypoint.sh  etc   lib    media  opt   root  sbin .d  du 

这里的-P是允许外部访问容器需要暴露的端口。

挂载一个主机目录作为数据卷

[root@localhost ~]# docker run -d -P --name web -v /aa:/du nginx
fcb37d4389aae5c26cdd14b2ec3f7a620a1854bef40f0d08edaf385aca1c0c6f
[root@localhost ~]# docker exec -it web /bin/bash
root@fcb37d4389aa:/# ls
bin   dev                  docker-entrypoint.sh  etc   lib    media  opt   root  sbin  sys  usr
boot  docker-entrypoint.d  du  

[root@localhost ~]# ls /             主机上也有一个aa的目录
 aa 

上面的命令加载主机的 '/aa’目录到容器的/du`目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。

Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:

[root@localhost ~]# docker run -d -P --name web -v /aa:/du:ro nginx
ea30efec7eb68cb0e3cb0e833d5818492c06eb4b98c36a1183e6adc31f5d07bd
[root@localhost ~]# docker exec -it web /bin/bash
root@ea30efec7eb6:/# cd /du/
root@ea30efec7eb6:/du# mkdir qq 
mkdir: cannot create directory 'qq': Read-only file system

数据卷容器

如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

[root@localhost ~]# docker run -it -d --name du -v /aa centos

然后可以在其他容器中使用–volumes-from来挂载aa容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:

[root@localhost ~]# docker run -d --name du1 --volumes-from du centos
[root@localhost ~]# docker run -d --name du2 --volumes-from du centos

此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
例如,在du1容器中创建一个test文件:

[root@localhost ~]# docker exec -it du1 /bin/bash
[root@84b20c43ce20 /]# ls
bin  aa  dev  etc  home  lib  lib64  lost+found  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@84b20c43ce20 /]# cd aa/
[root@84b20c43ce20 aa]# touch test
[root@84b20c43ce20 aa]# ls
test

在db2容器中查看:

[root@localhost ~]# docker exec -it du2 /bin/bash
[root@a2b5cb6bf5b9 /]# ls aa/
test

可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:

[root@localhost ~]# docker run -d --name du3 --volumes-from du1 centos

使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。

Docker 源码部署web服务

[root@localhost ~]# docker pull dugxq/apache  下载源码部署apache镜像

使用下载好的apache镜像部署web服务
[root@localhost ~]#docker run  --name apa -it  -p 80:80  -v /data:/usr/local/apache/htdocs/  dugxq/apache  /bin/bash

进入/data 下载电视直播源码包并解压
[root@localhost ~]# cd /data/
[root@localhost data]# wget https://zdown.chinaz.com/202107/win8fgbd-v2.1.zip
[root@localhost data]#unzip win8fgbd-v2.1.zip

进入刚创建的容器,开启httpd服务
[root@localhost ~]# docker exec -it apa /bin/bash
[root@a70997264dd4 /]# /usr/local/apache/bin/./apachectl
[root@a70997264dd4 /]# ss -anlt
State                Recv-Q               Send-Q                             Local Address:Port                             Peer Address:Port              Process               
LISTEN               0                    128                                      0.0.0.0:80                                    0.0.0.0:*  

测试

image-1660188915249