kubernetes/kubernetes-数据存储.md

828 lines
23 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<h2><center>kubernetes 数据存储</center></h2>
------
## 一:数据存储
在前面已经提到容器的生命周期可能很短会被频繁地创建和销毁。那么容器在销毁时保存在容器中的数据也会被清除。这种结果对用户来说在某些情况下是不乐意看到的。为了持久化保存容器的数据kubernetes引入了Volume的概念。
Volume是Pod中能够被多个容器访问的共享目录它被定义在Pod上然后被一个Pod里的多个容器挂载到具体的文件目录下kubernetes通过Volume实现同一个Pod中不同容器之间的数据共享以及数据的持久化存储。Volume的生命容器不与Pod中单个容器的生命周期相关当容器终止或者重启时Volume中的数据也不会丢失。
kubernetes的Volume支持多种类型比较常见的有下面几个
- 简单存储EmptyDir、HostPath、NFS
- 高级存储PV、PVC
- 配置存储ConfigMap、Secret
### 1. 基本存储
**EmptyDir**
EmptyDir是最基础的Volume类型一个EmptyDir就是Host上的一个空目录。
EmptyDir是在Pod被分配到Node时创建的它的初始内容为空并且无须指定宿主机上对应的目录文件因为kubernetes会自动分配一个目录当Pod销毁时 EmptyDir中的数据也会被永久删除。 EmptyDir用途如下
- 临时空间,例如用于某些应用程序运行时所需的临时目录,且无须永久保留
- 一个容器需要从另一个容器中获取数据的目录(多容器共享目录)
接下来通过一个容器之间文件共享的案例来使用一下EmptyDir。
在一个Pod中准备两个容器nginx和busybox然后声明一个Volume分别挂在到两个容器的目录中然后nginx容器负责向Volume中写日志busybox中通过命令将日志内容读到控制台。
![](http://182.92.143.66:40072/directlink/img/kubernetes/images-202505120032.png)
创建一个volume-emptydir.yaml
```yaml
apiVersion: v1
kind: Pod
metadata:
name: volume-emptydir
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
volumeMounts:
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","tail -f /logs/access.log"]
volumeMounts:
- name: logs-volume
mountPath: /logs
volumes:
- name: logs-volume
emptyDir: {}
```
```bash
# 创建Pod
[root@master ~]# kubectl create -f volume-emptydir.yaml
pod/volume-emptydir created
# 查看pod
[root@master ~]# kubectl get pods volume-emptydir -n dev -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
volume-emptydir 2/2 Running 0 53s 10.244.1.4 node1 <none> <none>
# 通过podIp访问nginx
[root@master ~]# curl 10.244.1.4
<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx!</title>
<style>
body {
width: 35em;
margin: 0 auto;
font-family: Tahoma, Verdana, Arial, sans-serif;
}
</style>
</head>
<body>
<h1>Welcome to nginx!</h1>
<p>If you see this page, the nginx web server is successfully installed and
working. Further configuration is required.</p>
<p>For online documentation and support please refer to
<a href="http://nginx.org/">nginx.org</a>.<br/>
Commercial support is available at
<a href="http://nginx.com/">nginx.com</a>.</p>
<p><em>Thank you for using nginx.</em></p>
</body>
</html>
# 通过kubectl logs命令查看指定容器的标准输出
[root@master ~]# kubectl logs -f volume-emptydir -n dev -c busybox
10.244.0.0 - - [12/May/2025:09:04:48 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.29.0" "-"
```
**HostPath**
上节课提到EmptyDir中数据不会被持久化它会随着Pod的结束而销毁如果想简单的将数据持久化到主机中可以选择HostPath。
HostPath就是将Node主机中一个实际目录挂在到Pod中以供容器使用这样的设计就可以保证Pod销毁了但是数据依据可以存在于Node主机上。
![](http://182.92.143.66:40072/directlink/img/kubernetes/images-202505120033.png)
创建一个volume-hostpath.yaml
```yaml
apiVersion: v1
kind: Pod
metadata:
name: volume-hostpath
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
volumeMounts:
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","tail -f /logs/access.log"]
volumeMounts:
- name: logs-volume
mountPath: /logs
volumes:
- name: logs-volume
hostPath:
path: /root/logs
type: DirectoryOrCreate
```
关于type的值的一点说明
- DirectoryOrCreate 目录存在就使用,不存在就先创建后使用
- Directory 目录必须存在
- FileOrCreate 文件存在就使用,不存在就先创建后使用
- File 文件必须存在
- Socket unix套接字必须存在
- CharDevice 字符设备必须存在
- BlockDevice 块设备必须存在
```bash
# 创建Pod
[root@master ~]# kubectl create -f volume-hostpath.yaml
pod/volume-hostpath created
# 查看Pod
[root@master ~]# kubectl get pods volume-hostpath -n dev -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
volume-hostpath 2/2 Running 0 65s 10.244.2.6 node2 <none> <none>
# 访问nginx
[root@master ~]# curl 10.244.2.6
<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx!</title>
<style>
body {
width: 35em;
margin: 0 auto;
font-family: Tahoma, Verdana, Arial, sans-serif;
}
</style>
</head>
<body>
<h1>Welcome to nginx!</h1>
<p>If you see this page, the nginx web server is successfully installed and
working. Further configuration is required.</p>
<p>For online documentation and support please refer to
<a href="http://nginx.org/">nginx.org</a>.<br/>
Commercial support is available at
<a href="http://nginx.com/">nginx.com</a>.</p>
<p><em>Thank you for using nginx.</em></p>
</body>
</html>
[root@master ~]# kubectl logs -f volume-emptydir -n dev -c busybox
10.244.0.0 - - [12/May/2025:09:04:48 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.29.0" "-"
# 接下来就可以去host的/root/logs目录下查看存储的文件了
### 注意: 下面的操作需要到Pod所在的节点运行案例中是node1
[root@node2 ~]# ls /root/logs
access.log error.log
# 同样的道理,如果在此目录下创建一个文件,到容器中也是可以看到的
```
NFS
HostPath可以解决数据持久化的问题但是一旦Node节点故障了Pod如果转移到了别的节点又会出现问题了此时需要准备单独的网络存储系统比较常用的用NFS、CIFS。
NFS是一个网络文件存储系统可以搭建一台NFS服务器然后将Pod中的存储直接连接到NFS系统上这样的话无论Pod在节点上怎么转移只要Node跟NFS的对接没问题数据就可以成功访问。
![](http://182.92.143.66:40072/directlink/img/kubernetes/images-202505120034.png)
1首先要准备nfs的服务器这里为了简单直接是master节点做nfs服务器
```bash
# 在nfs上安装nfs服务
[root@master ~]# yum -y install nfs-utils
# 准备一个共享目录
[root@master ~]# mkdir /root/data/nfs -pv
# 将共享目录以读写权限暴露给192.168.5.0/24网段中的所有主机
[root@master ~]# vim /etc/exports
/root/data/nfs 192.168.159.0/24(rw,no_root_squash)
# 启动nfs服务
[root@master ~]# systemctl restart nfs
```
2接下来要在的每个node节点上都安装下nfs这样的目的是为了node节点可以驱动nfs设备
```bash
[root@node1 ~]# yum -y install nfs-utils
```
3接下来就可以编写pod的配置文件了创建volume-nfs.yaml
```yaml
apiVersion: v1
kind: Pod
metadata:
name: volume-nfs
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
volumeMounts:
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","tail -f /logs/access.log"]
volumeMounts:
- name: logs-volume
mountPath: /logs
volumes:
- name: logs-volume
nfs:
server: 192.168.159.130
path: /root/data/nfs
```
4最后运行下pod观察结果
```bash
# 创建pod
[root@master ~]# kubectl create -f volume-nfs.yaml
pod/volume-nfs created
# 查看pod
[root@master ~]# kubectl get pods volume-nfs -n dev
NAME READY STATUS RESTARTS AGE
volume-nfs 2/2 Running 0 19s
# 查看nfs服务器上的共享目录发现已经有文件了
[root@master ~]# ls /root/data/nfs/
access.log error.log
```
### 2. 高级存储
前面已经学习了使用NFS提供存储此时就要求用户会搭建NFS系统并且会在yaml配置nfs。由于kubernetes支持的存储系统有很多要求客户全都掌握显然不现实。为了能够屏蔽底层存储实现的细节方便用户使用 kubernetes引入PV和PVC两种资源对象。
- PVPersistent Volume是持久化卷的意思是对底层的共享存储的一种抽象。一般情况下PV由kubernetes管理员进行创建和配置它与底层具体的共享存储技术有关并通过插件完成与共享存储的对接。
- PVCPersistent Volume Claim是持久卷声明的意思是用户对于存储需求的一种声明。换句话说PVC其实就是用户向kubernetes系统发出的一种资源需求申请。
![](http://182.92.143.66:40072/directlink/img/kubernetes/images-202505120035.png)
使用了PV和PVC之后工作可以得到进一步的细分
- 存储:存储工程师维护
- PV kubernetes管理员维护
- PVCkubernetes用户维护
**PV**
PV是存储资源的抽象下面是资源清单文件:
```yaml
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv2
spec:
nfs: # 存储类型,与底层真正存储对应
capacity: # 存储能力,目前只支持存储空间的设置
storage: 2Gi
accessModes: # 访问模式
storageClassName: # 存储类别
persistentVolumeReclaimPolicy: # 回收策略
```
PV 的关键配置参数说明:
- 存储类型
底层实际存储的类型kubernetes支持多种存储类型每种存储类型的配置都有所差异
- 存储能力capacity
目前只支持存储空间的设置( storage=1Gi )不过未来可能会加入IOPS、吞吐量等指标的配置
- 访问模式accessModes
用于描述用户应用对存储资源的访问权限,访问权限包括下面几种方式:
1. ReadWriteOnceRWO读写权限但是只能被单个节点挂载
2. ReadOnlyManyROX 只读权限,可以被多个节点挂载
3. ReadWriteManyRWX读写权限可以被多个节点挂载
- 回收策略persistentVolumeReclaimPolicy
当PV不再被使用了之后对其的处理方式。目前支持三种策略
1. Retain (保留) 保留数据,需要管理员手工清理数据
2. Recycle回收 清除 PV 中的数据,效果相当于执行 rm -rf /thevolume/*
3. Delete (删除) 与 PV 相连的后端存储完成 volume 的删除操作,当然这常见于云服务商的存储服务
- 存储类别
PV可以通过storageClassName参数指定一个存储类别
- 具有特定类别的PV只能与请求了该类别的PVC进行绑定
- 未设定类别的PV则只能与不请求任何类别的PVC进行绑定
- 状态status
一个 PV 的生命周期中可能会处于4中不同的阶段
1. Available可用 表示可用状态,还未被任何 PVC 绑定
2. Bound已绑定 表示 PV 已经被 PVC 绑定
3. Released已释放 表示 PVC 被删除,但是资源还未被集群重新声明
4. Failed失败 表示该 PV 的自动回收失败
实验
使用NFS作为存储来演示PV的使用创建3个PV对应NFS中的3个暴露的路径。
1.准备NFS环境
```bash
# 创建目录
[root@master ~]# mkdir /root/data/{pv1,pv2,pv3} -pv
# 暴露服务
[root@master ~]# vim /etc/exports
/root/data/pv1 192.168.159.0/24(rw,no_root_squash)
/root/data/pv2 192.168.159.0/24(rw,no_root_squash)
/root/data/pv3 192.168.159.0/24(rw,no_root_squash)
# 重启服务
[root@master ~]# systemctl restart nfs
```
2.创建pv.yaml
```yaml
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv1
spec:
capacity:
storage: 1Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
nfs:
path: /root/data/pv1
server: 192.168.159.130
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv2
spec:
capacity:
storage: 2Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
nfs:
path: /root/data/pv2
server: 192.168.159.130
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv3
spec:
capacity:
storage: 3Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
nfs:
path: /root/data/pv3
server: 192.168.159.130
```
```bash
# 创建pv
[root@master ~]# kubectl create -f pv.yaml
persistentvolume/pv1 created
persistentvolume/pv2 created
persistentvolume/pv3 created
# 查看pv
[root@master ~]# kubectl get pv -o wide
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE
pv1 1Gi RWX Retain Available 63s Filesystem
pv2 2Gi RWX Retain Available 63s Filesystem
pv3 3Gi RWX Retain Available 63s Filesystem
```
**PVC**
PVC是资源的申请用来声明对存储空间、访问模式、存储类别需求信息。下面是资源清单文件:
```yaml
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc
namespace: dev
spec:
accessModes: # 访问模式
selector: # 采用标签对PV选择
storageClassName: # 存储类别
resources: # 请求空间
requests:
storage: 5Gi
```
PVC 的关键配置参数说明:
- 访问模式accessModes
用于描述用户应用对存储资源的访问权限
- 选择条件selector
通过Label Selector的设置可使PVC对于系统中己存在的PV进行筛选
- 存储类别storageClassName
PVC在定义时可以设定需要的后端存储的类别只有设置了该class的pv才能被系统选出
- 资源请求Resources
描述对存储资源的请求
实验
1.创建pvc.yaml申请pv
```yaml
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc1
namespace: dev
spec:
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc2
namespace: dev
spec:
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc3
namespace: dev
spec:
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
```
```bash
# 创建pvc
[root@master ~]# kubectl create -f pvc.yaml
persistentvolumeclaim/pvc1 created
persistentvolumeclaim/pvc2 created
persistentvolumeclaim/pvc3 created
# 查看pvc
[root@master ~]# kubectl get pvc -n dev -o wide
NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE
pvc1 Bound pv1 1Gi RWX 13s Filesystem
pvc2 Bound pv2 2Gi RWX 13s Filesystem
pvc3 Bound pv3 3Gi RWX 13s Filesystem
# 查看pv
[root@master ~]# kubectl get pv -o wide
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE
pv1 1Gi RWX Retain Bound dev/pvc1 6m11s Filesystem
pv2 2Gi RWX Retain Bound dev/pvc2 6m11s Filesystem
pv3 3Gi RWX Retain Bound dev/pvc3 6m11s Filesystem
```
2.创建pods.yaml使用pv
```yaml
apiVersion: v1
kind: Pod
metadata:
name: pod1
namespace: dev
spec:
containers:
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","while true; do echo pod1 >> /root/out.txt; sleep 10; done;"]
volumeMounts:
- name: volume
mountPath: /root/
volumes:
- name: volume
persistentVolumeClaim:
claimName: pvc1
readOnly: false
---
apiVersion: v1
kind: Pod
metadata:
name: pod2
namespace: dev
spec:
containers:
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","while true;do echo pod2 >> /root/out.txt; sleep 10; done;"]
volumeMounts:
- name: volume
mountPath: /root/
volumes:
- name: volume
persistentVolumeClaim:
claimName: pvc2
readOnly: false
```
```bash
# 创建pod
[root@master ~]# kubectl create -f pods.yaml
pod/pod1 created
pod/pod2 created
# 查看pod
[root@master ~]# kubectl get pods -n dev -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
pod1 1/1 Running 0 11s 10.244.2.7 node2 <none> <none>
pod2 1/1 Running 0 11s 10.244.2.8 node2 <none> <none>
# 查看pvc
[root@master ~]# kubectl get pvc -n dev -o wide
NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE
pvc1 Bound pv1 1Gi RWX 7m4s Filesystem
pvc2 Bound pv2 2Gi RWX 7m4s Filesystem
pvc3 Bound pv3 3Gi RWX 7m4s Filesystem
# 查看pv
[root@master ~]# kubectl get pv -n dev -o wide
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE
pv1 1Gi RWX Retain Bound dev/pvc1 13m Filesystem
pv2 2Gi RWX Retain Bound dev/pvc2 13m Filesystem
pv3 3Gi RWX Retain Bound dev/pvc3 13m Filesystem
# 查看nfs中的文件存储
[root@master ~]# more /root/data/pv1/out.txt
pod1
pod1
pod1
pod1
pod1
pod1
[root@master ~]# more /root/data/pv2/out.txt
pod2
pod2
pod2
pod2
pod2
pod2
```
**生命周期**
PVC和PV是一一对应的PV和PVC之间的相互作用遵循以下生命周期
- 资源供应管理员手动创建底层存储和PV
- 资源绑定用户创建PVCkubernetes负责根据PVC的声明去寻找PV并绑定
在用户定义好PVC之后系统将根据PVC对存储资源的请求在已存在的PV中选择一个满足条件的
- 一旦找到就将该PV与用户定义的PVC进行绑定用户的应用就可以使用这个PVC了
- 如果找不到PVC则会无限期处于Pending状态直到等到系统管理员创建了一个符合其要求的PV
PV一旦绑定到某个PVC上就会被这个PVC独占不能再与其他PVC进行绑定了
- 资源使用用户可在pod中像volume一样使用pvc
Pod使用Volume的定义将PVC挂载到容器内的某个路径进行使用。
- 资源释放用户删除pvc来释放pv
当存储资源使用完毕后用户可以删除PVC与该PVC绑定的PV将会被标记为“已释放”但还不能立刻与其他PVC进行绑定。通过之前PVC写入的数据可能还被留在存储设备上只有在清除之后该PV才能再次使用。
- 资源回收kubernetes根据pv设置的回收策略进行资源的回收
对于PV管理员可以设定回收策略用于设置与之绑定的PVC释放资源之后如何处理遗留数据的问题。只有PV的存储空间完成回收才能供新的PVC绑定和使用
![](http://182.92.143.66:40072/directlink/img/kubernetes/images-202505120036.png)
### 3. 配置存储
**ConfigMap**
ConfigMap是一种比较特殊的存储卷它的主要作用是用来存储配置信息的。
创建configmap.yaml内容如下
```yaml
apiVersion: v1
kind: ConfigMap
metadata:
name: configmap
namespace: dev
data:
info:
username:admin
password:123456
```
接下来使用此配置文件创建configmap
```bash
# 创建configmap
[root@master ~]# kubectl create -f configmap.yaml
configmap/configmap created
# 查看configmap详情
[root@master ~]# kubectl describe cm configmap -n dev
Name: configmap
Namespace: dev
Labels: <none>
Annotations: <none>
Data
====
info:
----
username:admin password:123456
BinaryData
====
Events: <none>
```
接下来创建一个pod-configmap.yaml将上面创建的configmap挂载进去
```yaml
apiVersion: v1
kind: Pod
metadata:
name: pod-configmap
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
volumeMounts:
- name: config
mountPath: /configmap/config
volumes:
- name: config
configMap:
name: configmap
```
```bash
[root@master ~]# kubectl create -f pod-configmap.yaml
pod/pod-configmap created
[root@master ~]# kubectl get pod pod-configmap -n dev
NAME READY STATUS RESTARTS AGE
pod-configmap 1/1 Running 0 4s
[root@master ~]# kubectl exec -it pod-configmap -n dev /bin/sh
kubectl exec [POD] [COMMAND] is DEPRECATED and will be removed in a future version. Use kubectl exec [POD] -- [COMMAND] instead.
# cd /configmap/config/
# ls
info
# more info
username:admin password:123456
```
**Secret**
在kubernetes中还存在一种和ConfigMap非常类似的对象称为Secret对象。它主要用于存储敏感信息例如密码、秘钥、证书等等。
1.首先使用base64对数据进行编码
```bash
[root@master ~]# echo -n 'admin' | base64
YWRtaW4=
[root@master ~]# echo -n '123456' | base64
MTIzNDU2
```
2.接下来编写secret.yaml并创建Secret
```yaml
apiVersion: v1
kind: Secret
metadata:
name: secret
namespace: dev
type: Opaque
data:
username: YWRtaW4=
password: MTIzNDU2
```
```bash
# 创建secret
[root@master ~]# kubectl create -f secret.yaml
secret/secret created
# 查看secret详情
[root@master ~]# kubectl describe secret secret -n dev
Name: secret
Namespace: dev
Labels: <none>
Annotations: <none>
Type: Opaque
Data
====
username: 5 bytes
password: 6 bytes
```
3.创建pod-secret.yaml将上面创建的secret挂载进去
```yaml
apiVersion: v1
kind: Pod
metadata:
name: pod-secret
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
volumeMounts:
- name: config
mountPath: /secret/config
volumes:
- name: config
secret:
secretName: secret
```
```bash
# 创建pod
[root@master ~]# kubectl create -f pod-secret.yaml
pod/pod-secret created
# 查看pod
[root@master ~]# kubectl get pod pod-secret -n dev
NAME READY STATUS RESTARTS AGE
pod-secret 1/1 Running 0 4s
# 进入容器查看secret信息发现已经自动解码了
[root@master ~]# kubectl exec -it pod-secret /bin/sh -n dev
kubectl exec [POD] [COMMAND] is DEPRECATED and will be removed in a future version. Use kubectl exec [POD] -- [COMMAND] instead.
# ls /secret/config/
password username
# more /secret/config/username
admin
# more /secret/config/password
123456
```
至此已经实现了利用secret实现了信息的编码。