Kubernetes 入門
1. Kubernetes 生產(chǎn)環(huán)境
2. Kubernetes 最佳實踐
Kubernetes 概述
1. Kubernetes 簡介
2. Kubernetes 組件
3. Kubernetes API
Kubernetes 安裝
1. Kubernetes Linux安裝
2. Kubernetes macOS安裝
3. Kubernetes Windows安裝
Kubernetes 對象
1. Kubernetes 對象簡介
2. Kubernetes 對象管理
3. Kubernetes 對象名稱和IDs
4. Kubernetes 名字空間
5. Kubernetes 標(biāo)簽和選擇算符
6. Kubernetes 注解
7. Kubernetes Finalizers
8. Kubernetes 字段選擇器
9. Kubernetes 屬主與附屬
10. Kubernetes 推薦使用的標(biāo)簽
Kubernetes 架構(gòu)
1. Kubernetes 節(jié)點
2. Kubernetes 控制面到節(jié)點通信
3. Kubernetes 控制器
4. Kubernetes 云控制器管理器
5. Kubernetes 垃圾收集
6. Kubernetes 容器運行時接口（CRI）
Kubernetes 容器
1. Kubernetes 鏡像
2. Kubernetes 容器環(huán)境
3. Kubernetes 容器運行時類（Runtime Class）
4. Kubernetes 容器生命周期回調(diào)
Kubernetes Pods
1. Kubernetes Pod的生命周期
2. Kubernetes Init容器
3. Kubernetes Pod拓撲分布約束
4. Kubernetes 干擾（Disruptions）
5. Kubernetes 臨時容器
Kubernetes 工作負載資源
1. Kubernetes Deployments
2. Kubernetes ReplicaSet
3. Kubernetes StatefulSets
4. Kubernetes DaemonSet
5. Kubernetes Jobs
6. Kubernetes 已完成 Job 的自動清理
7. Kubernetes CronJob
8. Kubernetes ReplicationController
Kubernetes 服務(wù)、負載均衡和聯(lián)網(wǎng)
1. Kubernetes 使用拓撲鍵實現(xiàn)拓撲感知的流量路由
2. Kubernetes 服務(wù)
3. Kubernetes Pod 與 Service 的 DNS
4. Kubernetes 使用 Service 連接到應(yīng)用
5. Kubernetes Ingress
6. Kubernetes Ingress 控制器
7. Kubernetes 拓撲感知提示
8. Kubernetes 服務(wù)內(nèi)部流量策略
9. Kubernetes 端點切片（Endpoint Slices）
10. Kubernetes 網(wǎng)絡(luò)策略
11. Kubernetes IPv4/IPv6 雙協(xié)議棧
Kubernetes 存儲
1. Kubernetes 卷
2. Kubernetes 持久卷
3. Kubernetes 投射卷
4. Kubernetes 臨時卷
5. Kubernetes 存儲類
Kubernetes 配置
1. Kubernetes 配置最佳實踐
2. Kubernetes ConfigMap
3. Kubernetes Secret
4. Kubernetes 為 Pod 和容器管理資源
5. Kubernetes 使用 kubeconfig 文件組織集群訪問
6. Kubernetes Windows 節(jié)點的資源管理
Kubernetes 安全
1. Kubernetes 云原生安全概述
2. Kubernetes Pod安全性標(biāo)準(zhǔn)
3. Kubernetes Pod安全性準(zhǔn)入
4. Kubernetes Pod安全策略
5. Kubernetes Windows節(jié)點的安全性
6. Kubernetes API訪問控制
7. Kubernetes 基于角色的訪問控制良好實踐
Kubernetes 策略
1. Kubernetes 限制范圍
2. Kubernetes 資源配額
3. Kubernetes 進程ID約束與預(yù)留
4. Kubernetes 節(jié)點資源管理器
Kubernetes 調(diào)度，搶占和驅(qū)逐
1. Kubernetes 調(diào)度器
2. Kubernetes 將Pod指派給節(jié)點
3. Kubernetes Pod開銷
4. Kubernetes 污點和容忍度
5. Kubernetes Pod優(yōu)先級和搶占
6. Kubernetes 節(jié)點壓力驅(qū)逐
7. Kubernetes API發(fā)起的驅(qū)逐
8. Kubernetes 擴展資源的資源裝箱
9. Kubernetes 調(diào)度框架
10. Kubernetes 調(diào)度器性能調(diào)優(yōu)
Kubernetes 集群管理
1. Kubernetes 管理資源
2. Kubernetes 集群網(wǎng)絡(luò)系統(tǒng)
3. Kubernetes 系統(tǒng)組件指標(biāo)
4. Kubernetes 日志架構(gòu)
5. Kubernetes 系統(tǒng)日志
6. Kubernetes 追蹤系統(tǒng)組件
7. Kubernetes 代理
8. Kubernetes API優(yōu)先級和公平性
9. Kubernetes 安裝擴展（Addons）
Kubernetes 擴展
1. Kubernetes 擴展API
  1. Kubernetes 定制資源
  2. Kubernetes 通過聚合層擴展API
2. Kubernetes Operator模式
3. Kubernetes 計算、存儲和網(wǎng)絡(luò)擴展
  1. Kubernetes 網(wǎng)絡(luò)插件
  2. Kubernetes 設(shè)備插件
4. Kubernetes 服務(wù)目錄
Kubernetes 應(yīng)用故障排除
1. Kubernetes 調(diào)試Pod
2. Kubernetes 調(diào)試Service
3. Kubernetes 調(diào)試StatefulSet
4. Kubernetes 調(diào)試Init容器
5. Kubernetes 確定Pod失敗的原因
6. Kubernetes 獲取正在運行容器的Shell
7. Kubernetes 調(diào)試運行中的Pod
Kubernetes 集群故障排查
1. Kubernetes 資源指標(biāo)管道
2. Kubernetes 節(jié)點健康監(jiān)測
3. Kubernetes 使用crictl對Kubernetes節(jié)點進行調(diào)試
4. Kubernetes Windows調(diào)試提示
5. Kubernetes 使用telepresence在本地開發(fā)和調(diào)試服務(wù)
6. Kubernetes 審計
7. Kubernetes 資源監(jiān)控工具
Kubernetes 管理集群
1. Kubernetes 從dockershim遷移
  1. Kubernetes 將節(jié)點上的容器運行時從Docker Engine改為containerd
  2. Kubernetes 將Docker Engine節(jié)點從dockershim遷移到cri-dockerd
  3. Kubernetes CNI插件相關(guān)錯誤故障排除
  4. Kubernetes 查明節(jié)點上所使用的容器運行時
  5. Kubernetes 檢查棄用Dockershim是否對你有影響
  6. Kubernetes 從dockershim遷移遙測和安全代理
2. Kubernetes 用kubeadm進行管理
  1. Kubernetes 使用kubeadm進行證書管理
  2. Kubernetes 配置cgroup驅(qū)動
  3. Kubernetes 重新配置kubeadm集群
  4. Kubernetes 升級kubeadm集群
  5. Kubernetes 添加Windows節(jié)點
  6. Kubernetes 升級Windows節(jié)點
3. Kubernetes 手動生成證書
4. Kubernetes 管理內(nèi)存，CPU和API資源
  1. Kubernetes 為命名空間配置默認的內(nèi)存請求和限制
  2. Kubernetes 為命名空間配置默認的CPU請求和限制
  3. Kubernetes 配置命名空間的最小和最大內(nèi)存約束
  4. Kubernetes 為命名空間配置CPU最小和最大約束
  5. Kubernetes 為命名空間配置內(nèi)存和CPU配額
  6. Kubernetes 配置命名空間下Pod配額
5. Kubernetes 安裝網(wǎng)絡(luò)策略驅(qū)動
  1. Kubernetes 使用Antrea提供NetworkPolicy
  2. Kubernetes 使用Calico提供NetworkPolicy
  3. Kubernetes 使用Cilium提供NetworkPolicy
  4. Kubernetes 使用kube-router提供NetworkPolicy
  5. Kubernetes 使用Romana提供NetworkPolicy
  6. Kubernetes 使用Weave Net提供NetworkPolicy
6. Kubernetes IP Masquerade Agent用戶指南
7. Kubernetes 云管理控制器
8. Kubernetes 驗證簽名的容器鏡像
9. Kubernetes 運行 etcd 集群
10. Kubernetes 為系統(tǒng)守護進程預(yù)留計算資源
11. Kubernetes 為節(jié)點發(fā)布擴展資源
12. Kubernetes 以非root用戶身份運行Kubernetes節(jié)點組件
13. Kubernetes 使用CoreDNS進行服務(wù)發(fā)現(xiàn)
14. Kubernetes 使用KMS驅(qū)動進行數(shù)據(jù)加密
15. Kubernetes 使用Kubernetes API訪問集群
16. Kubernetes 使用NUMA感知的內(nèi)存管理器
17. Kubernetes 保護集群
18. Kubernetes 關(guān)鍵插件Pod的調(diào)度保證
19. Kubernetes 升級集群
20. Kubernetes 名字空間演練
21. Kubernetes 啟用/禁用Kubernetes API
22. Kubernetes 在Kubernetes集群中使用NodeLocal DNSCache
23. Kubernetes 在Kubernetes集群中使用sysctl
24. Kubernetes 在運行中的集群上重新配置節(jié)點的kubelet
25. Kubernetes 在集群中使用級聯(lián)刪除
26. Kubernetes 聲明網(wǎng)絡(luò)策略
27. Kubernetes 安全地清空一個節(jié)點
28. Kubernetes 開發(fā)云控制器管理器
29. Kubernetes 開啟服務(wù)拓撲
30. Kubernetes 控制節(jié)點上的CPU管理策略
31. Kubernetes 控制節(jié)點上的拓撲管理策略
32. Kubernetes 改變默認StorageClass
33. Kubernetes 更改PersistentVolume的回收策略
34. Kubernetes 自動擴縮集群DNS服務(wù)
35. Kubernetes 自定義DNS服務(wù)
36. Kubernetes 調(diào)試DNS問題
37. Kubernetes 遷移多副本的控制面以使用云控制器管理器
38. Kubernetes 通過名字空間共享集群
39. Kubernetes 通過配置文件設(shè)置Kubelet參數(shù)
40. Kubernetes 配置API對象配額
41. Kubernetes 限制存儲消耗
42. Kubernetes 靜態(tài)加密Secret數(shù)據(jù)
Kubernetes 配置Pods和容器
1. Kubernetes 為容器和Pod分配內(nèi)存資源
2. Kubernetes 為Windows Pod和容器配置GMSA
3. Kubernetes 為Windows的Pod和容器配置RunAsUserName
4. Kubernetes 為容器和Pods分配CPU資源
5. Kubernetes 創(chuàng)建Windows HostProcess Pod
6. Kubernetes 配置Pod的服務(wù)質(zhì)量
7. Kubernetes 為容器分派擴展資源
8. Kubernetes 配置Pod以使用卷進行存儲
9. Kubernetes 配置Pod以使用PersistentVolume作為存儲
10. Kubernetes 配置Pod使用投射卷作存儲
11. Kubernetes 為Pod或容器配置安全上下文
12. Kubernetes 為Pod配置服務(wù)賬戶
13. Kubernetes 從私有倉庫拉取鏡像
14. Kubernetes 配置存活、就緒和啟動探測器
15. Kubernetes 將Pod分配給節(jié)點
16. Kubernetes 用節(jié)點親和性把Pods分配到節(jié)點
17. Kubernetes 配置Pod初始化
18. Kubernetes 為容器的生命周期事件設(shè)置處理函數(shù)
19. Kubernetes 配置Pod使用ConfigMap
20. Kubernetes 在Pod中的容器之間共享進程命名空間
21. Kubernetes 創(chuàng)建靜態(tài)Pod
22. Kubernetes 將Docker Compose文件轉(zhuǎn)換為Kubernetes資源
23. Kubernetes 從PodSecurityPolicy遷移到內(nèi)置的PodSecurity準(zhǔn)入控制器
24. Kubernetes 使用名字空間標(biāo)簽來實施Pod安全性標(biāo)準(zhǔn)
25. Kubernetes 通過配置內(nèi)置準(zhǔn)入控制器實施Pod安全標(biāo)準(zhǔn)
Kubernetes 管理Kubernetes對象
1. Kubernetes 使用配置文件對Kubernetes對象進行聲明式管理
2. Kubernetes 使用Kustomize對Kubernetes對象進行聲明式管理
3. Kubernetes 使用指令式命令管理Kubernetes對象
4. Kubernetes 使用配置文件對Kubernetes對象進行命令式管理
5. Kubernetes 使用kubectl patch更新API對象
Kubernetes 管理Secrets
1. Kubernetes 使用kubectl管理Secret
2. Kubernetes 使用配置文件管理Secret
3. Kubernetes 使用Kustomize管理Secret
Kubernetes 給應(yīng)用注入數(shù)據(jù)
1. Kubernetes 為容器設(shè)置啟動時要執(zhí)行的命令和參數(shù)
2. Kubernetes 為容器設(shè)置環(huán)境變量
3. Kubernetes 定義相互依賴的環(huán)境變量
4. Kubernetes 通過環(huán)境變量將Pod信息呈現(xiàn)給容器
5. Kubernetes 通過文件將Pod信息呈現(xiàn)給容器
6. Kubernetes 使用Secret安全地分發(fā)憑證
Kubernetes 運行應(yīng)用
1. Kubernetes 使用Deployment運行一個無狀態(tài)應(yīng)用
2. Kubernetes 運行一個單實例有狀態(tài)應(yīng)用
3. Kubernetes 運行一個有狀態(tài)的應(yīng)用程序
4. Kubernetes 刪除StatefulSet
5. Kubernetes 強制刪除StatefulSet中的Pods
6. Kubernetes Pod水平自動擴縮
7. Kubernetes HorizontalPodAutoscaler演練
8. Kubernetes 為應(yīng)用程序設(shè)置干擾預(yù)算（Disruption Budget）
9. Kubernetes 從Pod中訪問Kubernetes API
10. Kubernetes 擴縮StatefulSet
Kubernetes 運行Jobs
1. Kubernetes 使用CronJob運行自動化任務(wù)
2. Kubernetes 使用工作隊列進行粗粒度并行處理
3. Kubernetes 使用工作隊列進行精細的并行處理
4. Kubernetes 使用索引作業(yè)完成靜態(tài)工作分配下的并行處理
5. Kubernetes 使用展開的方式進行并行處理
Kubernetes 訪問集群中的應(yīng)用程序
1. Kubernetes 部署和訪問Kubernetes儀表板（Dashboard）
2. Kubernetes 訪問集群
3. Kubernetes 使用端口轉(zhuǎn)發(fā)來訪問集群中的應(yīng)用
4. Kubernetes 使用服務(wù)來訪問集群中的應(yīng)用
5. Kubernetes 使用Service把前端連接到后端
6. Kubernetes 創(chuàng)建外部負載均衡器
7. Kubernetes 列出集群中所有運行容器的鏡像
8. Kubernetes 在Minikube環(huán)境中使用NGINX Ingress控制器配置Ingress
9. Kubernetes 為集群配置DNS
10. Kubernetes 同Pod內(nèi)的容器使用共享卷通信
11. Kubernetes 訪問集群上運行的服務(wù)
12. Kubernetes 配置對多集群的訪問
Kubernetes 擴展Kubernetes
1. Kubernetes 使用自定義資源
  1. Kubernetes 使用CustomResourceDefinition擴展Kubernetes API
  2. Kubernetes CustomResourceDefinition的版本
2. Kubernetes 配置聚合層
3. Kubernetes 安裝一個擴展的API server
4. Kubernetes 配置多個調(diào)度器
5. Kubernetes 使用HTTP代理訪問Kubernetes API
6. Kubernetes 使用SOCKS5代理訪問Kubernetes API
7. Kubernetes 設(shè)置Konnectivity服務(wù)
Kubernetes TLS
1. Kubernetes 為kubelet配置證書輪換
2. Kubernetes 手動輪換CA證書
3. Kubernetes 管理集群中的TLS認證
Kubernetes 管理集群守護進程
1. Kubernetes 對DaemonSet執(zhí)行滾動更新
2. Kubernetes 對DaemonSet執(zhí)行回滾
Kubernetes 安裝服務(wù)目錄
1. Kubernetes 使用Helm安裝Service Catalog
2. Kubernetes 使用SC安裝服務(wù)目錄
Kubernetes 網(wǎng)絡(luò)
1. Kubernetes 使用HostAliases向Pod /etc/hosts文件添加條目
2. Kubernetes 驗證IPv4/IPv6雙協(xié)議棧
Kubernetes 任務(wù)
1. Kubernetes 調(diào)度GPUs
2. Kubernetes 管理巨頁（HugePages）
3. Kubernetes 配置kubelet鏡像憑據(jù)提供程序
4. Kubernetes 用插件擴展kubectl
Kubernetes 安全
1. Kubernetes 使用AppArmor限制容器對資源的訪問
2. Kubernetes 在集群級別應(yīng)用Pod安全標(biāo)準(zhǔn)
3. Kubernetes 在名字空間級別應(yīng)用Pod安全標(biāo)準(zhǔn)
4. Kubernetes 使用seccomp限制容器的系統(tǒng)調(diào)用
Kubernetes 無狀態(tài)應(yīng)用程序
1. Kubernetes 公開外部IP地址以訪問集群中應(yīng)用程序
2. Kubernetes 示例：使用Redis部署PHP留言板應(yīng)用程序
Kubernetes 有狀態(tài)的應(yīng)用
1. Kubernetes StatefulSet基礎(chǔ)
2. Kubernetes 示例：使用Persistent Volumes部署WordPress和MySQL
3. Kubernetes 示例：使用StatefulSet部署Cassandra
4. Kubernetes 運行ZooKeeper，一個分布式協(xié)調(diào)系統(tǒng)
Kubernetes Service
1. Kubernetes 使用源IP

閱讀(1.8k) 書簽贊(0) 我要糾錯

Kubernetes Pod拓撲分布約束

2022-04-29 14:48 更新

Pod 拓撲分布約束

FEATURE STATE: Kubernetes v1.19 [stable]

你可以使用拓撲分布約束（Topology Spread Constraints）來控制 Pods 在集群內(nèi)故障域之間的分布，例如區(qū)域（Region）、可用區(qū)（Zone）、節(jié)點和其他用戶自定義拓撲域。這樣做有助于實現(xiàn)高可用并提升資源利用率。

先決條件

節(jié)點標(biāo)簽

拓撲分布約束依賴于節(jié)點標(biāo)簽來標(biāo)識每個節(jié)點所在的拓撲域。例如，某節(jié)點可能具有標(biāo)簽：?node=node1,zone=us-east-1a,region=us-east-1?

假設(shè)你擁有具有以下標(biāo)簽的一個 4 節(jié)點集群：

NAME    STATUS   ROLES    AGE     VERSION   LABELS
node1   Ready    <none>   4m26s   v1.16.0   node=node1,zone=zoneA
node2   Ready    <none>   3m58s   v1.16.0   node=node2,zone=zoneA
node3   Ready    <none>   3m17s   v1.16.0   node=node3,zone=zoneB
node4   Ready    <none>   2m43s   v1.16.0   node=node4,zone=zoneB

那么，從邏輯上看集群如下：

你可以復(fù)用在大多數(shù)集群上自動創(chuàng)建和填充的常用標(biāo)簽，而不是手動添加標(biāo)簽。

Pod 的分布約束

API

?pod.spec.topologySpreadConstraints? 字段定義如下所示：

apiVersion: v1
kind: Pod
metadata:
  name: mypod
spec:
  topologySpreadConstraints:
    - maxSkew: <integer>
      topologyKey: <string>
      whenUnsatisfiable: <string>
      labelSelector: <object>

你可以定義一個或多個 ?topologySpreadConstraint? 來指示 kube-scheduler 如何根據(jù)與現(xiàn)有的 Pod 的關(guān)聯(lián)關(guān)系將每個傳入的 Pod 部署到集群中。字段包括：

maxSkew 描述 Pod 分布不均的程度。這是給定拓撲類型中任意兩個拓撲域中匹配的 pod 之間的最大允許差值。它必須大于零。取決于 ?whenUnsatisfiable ?的取值，其語義會有不同。

當(dāng) ?whenUnsatisfiable ?等于 "DoNotSchedule" 時，?maxSkew ?是目標(biāo)拓撲域中匹配的 Pod 數(shù)與全局最小值之間可存在的差異。
當(dāng) ?whenUnsatisfiable ?等于 "ScheduleAnyway" 時，調(diào)度器會更為偏向能夠降低偏差值的拓撲域。

topologyKey 是節(jié)點標(biāo)簽的鍵。如果兩個節(jié)點使用此鍵標(biāo)記并且具有相同的標(biāo)簽值，則調(diào)度器會將這兩個節(jié)點視為處于同一拓撲域中。調(diào)度器試圖在每個拓撲域中放置數(shù)量均衡的 Pod。
whenUnsatisfiable 指示如果 Pod 不滿足分布約束時如何處理：

?DoNotSchedule?（默認）告訴調(diào)度器不要調(diào)度。
?ScheduleAnyway ?告訴調(diào)度器仍然繼續(xù)調(diào)度，只是根據(jù)如何能將偏差最小化來對節(jié)點進行排序。

labelSelector 用于查找匹配的 pod。匹配此標(biāo)簽的 Pod 將被統(tǒng)計，以確定相應(yīng) 拓撲域中 Pod 的數(shù)量。

當(dāng) Pod 定義了不止一個 ?topologySpreadConstraint?，這些約束之間是邏輯與的關(guān)系。 kube-scheduler 會為新的 Pod 尋找一個能夠滿足所有約束的節(jié)點。

你可以執(zhí)行 ?kubectl explain Pod.spec.topologySpreadConstraints? 命令以了解關(guān)于 topologySpreadConstraints 的更多信息。

例子：單個 TopologySpreadConstraint

假設(shè)你擁有一個 4 節(jié)點集群，其中標(biāo)記為 ?foo:bar? 的 3 個 Pod 分別位于 node1、node2 和 node3 中：

如果希望新來的 Pod 均勻分布在現(xiàn)有的可用區(qū)域，則可以按如下設(shè)置其規(guī)約：

kind: Pod
apiVersion: v1
metadata:
  name: mypod
  labels:
    foo: bar
spec:
  topologySpreadConstraints:
  - maxSkew: 1
    topologyKey: zone
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  containers:
  - name: pause
    image: k8s.gcr.io/pause:3.1

?topologyKey: zone? 意味著均勻分布將只應(yīng)用于存在標(biāo)簽鍵值對為 "zone:<any value>" 的節(jié)點。 ?whenUnsatisfiable: DoNotSchedule? 告訴調(diào)度器如果新的 Pod 不滿足約束，則讓它保持懸決狀態(tài)。

如果調(diào)度器將新的 Pod 放入 "zoneA"，Pods 分布將變?yōu)?nbsp;[3, 1]，因此實際的偏差為 2（3 - 1）。這違反了 ?maxSkew: 1? 的約定。此示例中，新 Pod 只能放置在 "zoneB" 上：

或者

你可以調(diào)整 Pod 規(guī)約以滿足各種要求：

將 ?maxSkew ?更改為更大的值，比如 "2"，這樣新的 Pod 也可以放在 "zoneA" 上。
將 ?topologyKey ?更改為 "node"，以便將 Pod 均勻分布在節(jié)點上而不是區(qū)域中。在上面的例子中，如果 ?maxSkew ?保持為 "1"，那么傳入的 Pod 只能放在 "node4" 上。
將 ?whenUnsatisfiable: DoNotSchedule? 更改為 ?whenUnsatisfiable: ScheduleAnyway?，以確保新的 Pod 始終可以被調(diào)度（假設(shè)滿足其他的調(diào)度 API）。但是，最好將其放置在匹配 Pod 數(shù)量較少的拓撲域中。（請注意，這一優(yōu)先判定會與其他內(nèi)部調(diào)度優(yōu)先級（如資源使用率等）排序準(zhǔn)則一起進行標(biāo)準(zhǔn)化。）

例子：多個 TopologySpreadConstraints

下面的例子建立在前面例子的基礎(chǔ)上。假設(shè)你擁有一個 4 節(jié)點集群，其中 3 個標(biāo)記為 ?foo:bar? 的 Pod 分別位于 node1、node2 和 node3 上：

可以使用 2 個 TopologySpreadConstraint 來控制 Pod 在區(qū)域和節(jié)點兩個維度上的分布：

kind: Pod
apiVersion: v1
metadata:
  name: mypod
  labels:
    foo: bar
spec:
  topologySpreadConstraints:
  - maxSkew: 1
    topologyKey: zone
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  - maxSkew: 1
    topologyKey: node
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  containers:
  - name: pause
    image: k8s.gcr.io/pause:3.1

在這種情況下，為了匹配第一個約束，新的 Pod 只能放置在 "zoneB" 中；而在第二個約束中，新的 Pod 只能放置在 "node4" 上。最后兩個約束的結(jié)果加在一起，唯一可行的選擇是放置在 "node4" 上。

多個約束之間可能存在沖突。假設(shè)有一個跨越 2 個區(qū)域的 3 節(jié)點集群：

如果對集群應(yīng)用 "two-constraints.yaml"，會發(fā)現(xiàn) "mypod" 處于 ?Pending ?狀態(tài)。這是因為：為了滿足第一個約束，"mypod" 只能放在 "zoneB" 中，而第二個約束要求 "mypod" 只能放在 "node2" 上。Pod 調(diào)度無法滿足兩種約束。

為了克服這種情況，你可以增加 ?maxSkew ?或修改其中一個約束，讓其使用 ?whenUnsatisfiable: ScheduleAnyway?。

節(jié)點親和性與節(jié)點選擇器的相互作用

如果 Pod 定義了 ?spec.nodeSelector? 或 ?spec.affinity.nodeAffinity?，調(diào)度器將在偏差計算中跳過不匹配的節(jié)點。

示例：TopologySpreadConstraints 與 NodeAffinity

假設(shè)你有一個跨越 zoneA 到 zoneC 的 5 節(jié)點集群：

而且你知道 "zoneC" 必須被排除在外。在這種情況下，可以按如下方式編寫 YAML，以便將 "mypod" 放置在 "zoneB" 上，而不是 "zoneC" 上。同樣，?spec.nodeSelector? 也要一樣處理。

kind: Pod
apiVersion: v1
metadata:
  name: mypod
  labels:
    foo: bar
spec:
  topologySpreadConstraints:
  - maxSkew: 1
    topologyKey: zone
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: zone
            operator: NotIn
            values:
            - zoneC
  containers:
  - name: pause
    image: k8s.gcr.io/pause:3.1

調(diào)度器不會預(yù)先知道集群擁有的所有區(qū)域和其他拓撲域。拓撲域由集群中存在的節(jié)點確定。在自動伸縮的集群中，如果一個節(jié)點池（或節(jié)點組）的節(jié)點數(shù)量為零，而用戶正期望其擴容時，可能會導(dǎo)致調(diào)度出現(xiàn)問題。因為在這種情況下，調(diào)度器不會考慮這些拓撲域信息，因為它們是空的，沒有節(jié)點。

其他值得注意的語義

這里有一些值得注意的隱式約定：

只有與新的 Pod 具有相同命名空間的 Pod 才能作為匹配候選者。
調(diào)度器會忽略沒有 topologySpreadConstraints[*].topologyKey 的節(jié)點。這意味著：

位于這些節(jié)點上的 Pod 不影響 maxSkew 的計算。在上面的例子中，假設(shè) "node1" 沒有標(biāo)簽 "zone"，那么 2 個 Pod 將被忽略，因此傳入的 Pod 將被調(diào)度到 "zoneA" 中。
新的 Pod 沒有機會被調(diào)度到這類節(jié)點上。在上面的例子中，假設(shè)一個帶有標(biāo)簽 {zone-typo: zoneC} 的 "node5" 加入到集群，它將由于沒有標(biāo)簽鍵 "zone" 而被忽略。

注意，如果新 Pod 的 topologySpreadConstraints[*].labelSelector 與自身的標(biāo)簽不匹配，將會發(fā)生什么。在上面的例子中，如果移除新 Pod 上的標(biāo)簽，Pod 仍然可以調(diào)度到 "zoneB"，因為約束仍然滿足。然而，在調(diào)度之后，集群的不平衡程度保持不變。zoneA 仍然有 2 個帶有 {foo:bar} 標(biāo)簽的 Pod， zoneB 有 1 個帶有 {foo:bar} 標(biāo)簽的 Pod。因此，如果這不是你所期望的，建議工作負載的 topologySpreadConstraints[*].labelSelector 與其自身的標(biāo)簽匹配。

集群級別的默認約束

為集群設(shè)置默認的拓撲分布約束也是可能的。默認拓撲分布約束在且僅在以下條件滿足時才會應(yīng)用到 Pod 上：

Pod 沒有在其 ?.spec.topologySpreadConstraints? 設(shè)置任何約束；
Pod 隸屬于某個服務(wù)、副本控制器、ReplicaSet 或 StatefulSet。

你可以在調(diào)度方案（Scheduling Profile）中將默認約束作為 ?PodTopologySpread ?插件參數(shù)的一部分來設(shè)置。約束的設(shè)置采用如前所述的 API，只是 ?labelSelector ?必須為空。選擇算符是根據(jù) Pod 所屬的服務(wù)、副本控制器、ReplicaSet 或 StatefulSet 來設(shè)置的。

配置的示例可能看起來像下面這個樣子：

apiVersion: kubescheduler.config.k8s.io/v1beta3
kind: KubeSchedulerConfiguration

profiles:
  - schedulerName: default-scheduler
    pluginConfig:
      - name: PodTopologySpread
        args:
          defaultConstraints:
            - maxSkew: 1
              topologyKey: topology.kubernetes.io/zone
              whenUnsatisfiable: ScheduleAnyway
          defaultingType: List

默認調(diào)度約束所生成的評分可能與 SelectorSpread 插件所生成的評分有沖突。建議你在為 ?PodTopologySpread ?設(shè)置默認約束是禁用調(diào)度方案中的該插件。

內(nèi)部默認約束

FEATURE STATE: Kubernetes v1.20 [beta]

當(dāng)你使用了默認啟用的 ?DefaultPodTopologySpread? 特性門控時，原來的 ?SelectorSpread ?插件會被禁用。 kube-scheduler 會使用下面的默認拓撲約束作為 ?PodTopologySpread ?插件的配置：

defaultConstraints:
  - maxSkew: 3
    topologyKey: "kubernetes.io/hostname"
    whenUnsatisfiable: ScheduleAnyway
  - maxSkew: 5
    topologyKey: "topology.kubernetes.io/zone"
    whenUnsatisfiable: ScheduleAnyway

此外，原來用于提供等同行為的 ?SelectorSpread ?插件也會被禁用。

對于分布約束中所指定的拓撲鍵而言，?PodTopologySpread ?插件不會為不包含這些主鍵的節(jié)點評分。這可能導(dǎo)致在使用默認拓撲約束時，其行為與原來的 ?SelectorSpread ?插件的默認行為不同，

如果你的節(jié)點不會同時設(shè)置 ?kubernetes.io/hostname? 和 ?topology.kubernetes.io/zone? 標(biāo)簽，你應(yīng)該定義自己的約束而不是使用 Kubernetes 的默認約束。

如果你不想為集群使用默認的 Pod 分布約束，你可以通過設(shè)置 ?defaultingType ?參數(shù)為 ?List ?并將 ?PodTopologySpread ?插件配置中的 ?defaultConstraints ?參數(shù)置空來禁用默認 Pod 分布約束。

apiVersion: kubescheduler.config.k8s.io/v1beta3
kind: KubeSchedulerConfiguration

profiles:
  - schedulerName: default-scheduler
    pluginConfig:
      - name: PodTopologySpread
        args:
          defaultConstraints: []
          defaultingType: List

與 PodAffinity/PodAntiAffinity 相比較

在 Kubernetes 中，與“親和性”相關(guān)的指令控制 Pod 的調(diào)度方式（更密集或更分散）。

對于 ?PodAffinity?，你可以嘗試將任意數(shù)量的 Pod 集中到符合條件的拓撲域中。
對于 ?PodAntiAffinity?，只能將一個 Pod 調(diào)度到某個拓撲域中。

要實現(xiàn)更細粒度的控制，你可以設(shè)置拓撲分布約束來將 Pod 分布到不同的拓撲域下，從而實現(xiàn)高可用性或節(jié)省成本。這也有助于工作負載的滾動更新和平穩(wěn)地擴展副本規(guī)模。

已知局限性

當(dāng) Pod 被移除時，無法保證約束仍被滿足。例如，縮減某 Deployment 的規(guī)模時， Pod 的分布可能不再均衡。你可以使用 Descheduler 來重新實現(xiàn) Pod 分布的均衡。
具有污點的節(jié)點上匹配的 Pods 也會被統(tǒng)計。參考 Issue 80921。

以上內(nèi)容是否對您有幫助：

← Kubernetes Init容器

Kubernetes 干擾（Disruptions） →

寫筆記

我要補充