排查 AKS 边缘软件包中的常见问题

本文介绍了如何找到使用 AKS 边缘软件包时遇到问题的解决方案。 已知问题和错误按功能领域组织。 你可以使用本文中提供的链接找到解决方案和解决方法来解决它们。

提出支持请求

有关如何使用 Azure 门户获取支持或为 AKS 边缘软件包打开支持请求的信息,请参阅获取支持一文。

部署问题

不受信任的发布者问题

错误消息:“要运行来自此不受信任发布者的软件吗? ....."

解决方法:将 PowerShell 执行策略更新为 RemoteSigned

# Get the execution policy on the system
Get-ExecutionPolicy
# Set the execution policy for this process only
if ((Get-ExecutionPolicy) -ne "RemoteSigned") { Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process -Force }

磁盘空间不足导致先前缓存的容器映像被删除

当节点磁盘空间不足时,containerd 运行时会对一些预加载的映像进行垃圾回收。 在这种情况下,首先释放一些磁盘空间,然后运行以下命令再次拉取缓存的映像:

    Invoke-AksEdgeNodeCommand -NodeType Linux -command "sudo /path/to/script/reimport-ci.sh

此脚本会检查丢失的映像,并根据需要重新导入它们。

Azure Arc 连接

  1. 问题:Disconnect-AksEdgeArc 不会从群集中删除 Pod。

    解决方法:如果 Pod 未被清理,请在尝试重新连接之前运行以下命令手动清理现有的 Azure Arc 相关资源:

    kubectl delete ns azure-arc
    kubectl delete clusterrolebinding azure-arc-operator
    kubectl delete secret sh.helm.release.v1.azure-arc.v1
    
  2. 问题:Azure Arc 连接在代理环境中不起作用。

    解决方法:可以通过以下方式启用系统范围的代理设置:Internet 选项 > 连接 > LAN 设置

    显示了 Internet 选项的屏幕截图。

无法彻底删除包含 PodDisruptionBudget (PDB) 资源的 AKS Arc 群集

有关此已知问题的信息,请参阅 AKS Arc 文档中 无法完全删除具有 PDB 资源的 AKS Arc 群集

脱机部署

无法获取 nodeagent 证书:未找到

检查网络适配器配置。 在部署期间,AKS 边缘软件包需要一个已启用且具有正确 IP 地址、子网和默认网关的适配器。 这些值在 DHCP 环境中会自动填充。 如果手动设置,请确保这三个值都已设置。 在许多情况下,未设置默认网关,这会导致此错误。

Kubernetes

Kube-vip Pod 持续重启

在某些情况下, kube-vip Pod 会循环并持续重启。

验证

要确认遇到的情况与本文档中记录的问题相同,请通过运行以下命令检查 kube-system 命名空间中的 kube-vip Pod 是否有大量重启:

kubectl get pods –n kube-system

原因

kube-vip Pod 可能不断重启的原因有几个。 这些原因包括:

解决方法

要缓解此问题,请查看基础存储基础结构,确保其满足 etcd 和 AKS 边缘软件包的性能要求。 此外,考虑使用高级 SSD 支持的存储或优化存储配置以提高性能。

后续步骤

AKS 边缘软件包概述