排查 GKE 问题
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
本页面列出了问题排查页面,其中介绍了您在使用 Google Kubernetes Engine (GKE) 时可能会遇到的常见问题。本页面适用于负责排查 GKE 配置问题的管理员和架构师、安全专家、网络专家或存储专家。如需详细了解 GKE 角色,请参阅常见的 GKE Enterprise 用户角色和任务。
您可以使用本页面来诊断和解决在使用 GKE 基础设施的各个阶段遇到的问题:
您还可以通过本页面访问更通用的问题排查主题:
如需排查 GKE 网络问题,请参阅 GKE 网络文档中的排查 GKE 网络问题。
集群设置
主题 |
说明 |
创建集群 |
解决创建集群时的问题。 |
Autopilot 集群 |
诊断和排查 GKE Autopilot 集群问题,包括集群创建、命名空间删除、扩缩和工作负载问题。 |
Kubectl 命令行工具 |
排查 GKE 中 kubectl 命令行工具的问题,包括身份验证、授权问题。本页面还包含有关如何排查 Konnectivity 代理问题的建议,以检查该代理是否导致 kubectl logs 、attach 、exec 或 port-forward 命令停止响应。 |
Standard 节点池 |
排查 GKE Standard 节点池的问题,包括节点池创建、尽力而为的预配、损坏的实例元数据以及将工作负载迁移到新节点池的问题。 |
节点注册 |
排查将节点添加到 GKE Standard 集群时发生的问题,例如节点注册失败以及缺少成功注册节点的前提条件。 |
容器运行时 |
排查 GKE 中的容器运行时问题,包括 containerd 和 dockershim 以及私有注册表的问题。 |
存储
主题 |
说明 |
存储 |
排查存储问题,包括区域级永久性磁盘、磁盘性能和卷扩展的问题。 |
集群安全
集群的根证书授权机构即将过期
工作负载
集群管理
主题 |
说明 |
升级 |
排查 GKE 集群升级的问题,例如控制平面升级后 kube-apiserver 健康状况不佳,或者升级后工作负载被逐出。 |
网络钩子 |
了解如何在使用准入 webhook 时排查集群控制平面问题并确保其稳定性。 |
命名空间卡在 Terminating 状态 |
通过识别并移除阻止删除的健康状况不佳组件,排查命名空间卡在 Terminating 状态的问题。 |
监控
主题 |
说明 |
系统指标 |
排查系统指标未显示在 Cloud Monitoring 中的问题。 |
监控信息中心 |
排查监控信息中心的问题,包括启用监控功能、缺少 Kubernetes 资源和权限的问题。 |
Logging |
排查日志记录问题,包括启用日志记录功能、缺少日志和配额的问题。 |
4xx 错误
已知问题
主题 |
说明 |
已知问题 |
发现并解决可能影响 GKE 使用的已知问题。 |
后续步骤
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-07-15。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-07-15。"],[],[]]