本文介绍了如何找到使用 AKS 边缘软件包时遇到问题的解决方案。 已知问题和错误按功能领域组织。 你可以使用本文中提供的链接找到解决方案和解决方法来解决它们。
提出支持请求
有关如何使用 Azure 门户获取支持或为 AKS 边缘软件包打开支持请求的信息,请参阅获取支持一文。
部署问题
不受信任的发布者问题
错误消息:“要运行来自此不受信任发布者的软件吗? ....."
解决方法:将 PowerShell 执行策略更新为 RemoteSigned:
# Get the execution policy on the system
Get-ExecutionPolicy
# Set the execution policy for this process only
if ((Get-ExecutionPolicy) -ne "RemoteSigned") { Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process -Force }
磁盘空间不足导致先前缓存的容器映像被删除
当节点磁盘空间不足时,containerd 运行时会对一些预加载的映像进行垃圾回收。 在这种情况下,首先释放一些磁盘空间,然后运行以下命令再次拉取缓存的映像:
Invoke-AksEdgeNodeCommand -NodeType Linux -command "sudo /path/to/script/reimport-ci.sh
此脚本会检查丢失的映像,并根据需要重新导入它们。
Azure Arc 连接
问题:
Disconnect-AksEdgeArc不会从群集中删除 Pod。解决方法:如果 Pod 未被清理,请在尝试重新连接之前运行以下命令手动清理现有的 Azure Arc 相关资源:
kubectl delete ns azure-arc kubectl delete clusterrolebinding azure-arc-operator kubectl delete secret sh.helm.release.v1.azure-arc.v1问题:Azure Arc 连接在代理环境中不起作用。
解决方法:可以通过以下方式启用系统范围的代理设置:Internet 选项 > 连接 > LAN 设置。
无法彻底删除包含 PodDisruptionBudget (PDB) 资源的 AKS Arc 群集
有关此已知问题的信息,请参阅 AKS Arc 文档中 无法完全删除具有 PDB 资源的 AKS Arc 群集。
脱机部署
无法获取 nodeagent 证书:未找到
检查网络适配器配置。 在部署期间,AKS 边缘软件包需要一个已启用且具有正确 IP 地址、子网和默认网关的适配器。 这些值在 DHCP 环境中会自动填充。 如果手动设置,请确保这三个值都已设置。 在许多情况下,未设置默认网关,这会导致此错误。
Kubernetes
Kube-vip Pod 持续重启
在某些情况下, kube-vip Pod 会循环并持续重启。
验证
要确认遇到的情况与本文档中记录的问题相同,请通过运行以下命令检查 kube-system 命名空间中的 kube-vip Pod 是否有大量重启:
kubectl get pods –n kube-system
原因
kube-vip Pod 可能不断重启的原因有几个。 这些原因包括:
- 使用未由 SSD 盘支持的 OS 磁盘,或使用 Azure VM 时使用高级 SSD 盘。 可以在此处查看硬件要求。
- 磁盘延迟过高。 如果磁盘延迟大于 10 ms,可能会导致请求超时、领导者丢失和潜在的群集不稳定。 可以在此处查看 etcd 的硬件要求。
解决方法
要缓解此问题,请查看基础存储基础结构,确保其满足 etcd 和 AKS 边缘软件包的性能要求。 此外,考虑使用高级 SSD 支持的存储或优化存储配置以提高性能。
