文章主题:用ChatGPT搞定K8s!, Kubernetes, K8s, ChatGPT

666AI工具大全,助力做AI时代先行者!

用ChatGPT搞定K8s!

Kubernetes(简称 K8s)当前非常火爆,然而人们对其最多的抱怨仍然是其较高的复杂性。在云环境和本地环境中,都缺乏有效的集群故障排查手段。尽管如此,K8s 的采用率仍持续上升。这使得很多开发者和运维团队在面对这项相对新兴的技术时感到压力,他们不得不投入更多的时间和精力去学习新的术语、工作流程以及相应的工具等。

1、K8s难在哪里

Kubernetes(简称K8s)是一个高度可扩展的平台,用于自动部署、管理和扩展容器化应用程序。要在K8s中成功部署和管理容器化应用, requires extensive knowledge and expertise in various fields. Even during the setup process, understanding and configuring multiple components is crucial. Configuring a rotating K8s cluster involves knowledge and expertise in configuring not only pods but also services, including components like etcd, API server, kubelet, and kube-proxy. In other words, becoming an expert in K8s requires mastery of a broad range of technical skills and domain knowledge.

然后是规划、扩展和网络建设。一个失误可能很快转化为无数的可扩展性、可靠性甚至安全性问题。

此外,生态系统作为一个复杂的系统,其自身正在持续不断地发展和变化。对于初学者而言,可能会遇到众多工具和附加组件的选择和使用问题,同时难以紧跟其更新速度。值得注意的是,并非所有开发者都具备针对Kubernetes(K8s)技术的专业技能培训背景。

我们不能忽视,这项技术包含众多移动部件以及错综复杂的作用关系,一旦出现故障,排除故障将会变得异常艰难且耗时。要诊断故障原因,必须具备深厚技术知识和专业技能,而这些宝贵的信息和能力通常仅掌握在少数经验丰富的工程师手中。

让我们深入研究,探索有助于克服明显技能差距问题的新的创新方法。

2、没错,ChatGPT能当此大任

Kubernetes的学习和使用并不容易,原因在于其缺乏统一的方法论。K8s具有高度的可定制性,能够根据应用程序或基础设施的具体需求采用多种不同的配置方式。因此,要将从文档(众多且复杂)以及培训中获取的知识应用到现有环境中,往往面临团队对系统架构上下文理解和可见性的不足。

想要了解当前的系统架构状况,我们需要关注以下几个核心问题:首先,各个Pod是如何被绑定的,它们分别对应了哪些特定的命名空间?其次,各个节点的运行状态如何?针对这些问题,我们需要在不同的平台和工具之间进行灵活切换,以便全面掌握我国环境的整体情况。其中,AWS控制台、kubectl命令行、Terraform配置文件以及监控工具等都是我们不可或缺的助手。

如果我们可以问ChatGPT这些问题呢?

让我们看一个使用由ChatGPT提供支持的PromptOps来理解集群中所有部署的示例。PromptOps提供了一个免费的Kubernetes咨询工具,用户可以通过BASH脚本、文档参考和其他有用资源的形式提出问题并获得即时帮助。

用ChatGPT破解K8s难题

通过提供来自不同来源的PromptOps基础设施的碎片数据,如Confluence、Notion、Terraform配置文件等,我们希望PromptOps能够快速聚合所有信息,并帮助可视化架构。我们没有手动运行kubectl命令来检查部署,而是在聊天中提示PromptOps来描述集群中存在的部署。

以下是PromptOps的回应:

PromptOps > I suggest running this script to answer your question.

用ChatGPT破解K8s难题

PromptOps提供了一个要运行的脚本,并引用了一个包含集群信息的Notion页面。在执行脚本时,PromptOps提供集群内部署的输出。

用ChatGPT破解K8s难题

PromptOps还提供了集群中所有部署的可视化图,使学习更加容易。

用ChatGPT破解K8s难题

PromptOps的响应简化了Kubernetes基础设施管理,使DevOps团队中的每个人都能跟上当前架构的步伐并跟上变化。

通过自动化故障调查节省时间

让我们看看生产问题的疑难解答,看看PromptOps如何帮助确定Kubernetes中故障的根本原因。Kubernetes度量和日志提供了从集群到容器的所有级别的关键见解。它们提供有关资源利用率、pod和节点状态、集群自动缩放指标、网络错误、容器运行时间等信息。

但所有这些指标的问题在于,它们并没有立即发挥作用。日志流或度量图表无法提供必要的上下文或方向。有一些工具可以提供帮助,但它们往往会使事情变得更加复杂,需要在整个技术堆栈中提取上下文,以查看真正发生了什么,或者在出现问题时谁做了什么。在CtrlStack,我们一直在结合PromptOps来分析因果图、Kubernetes事件、指标和日志,以减少手动故障排除的挑战。目标是通过使用PromptOps生成解释原因的根本原因分析摘要,帮助DevOps团队快速理解Kubernetes问题。在本例中,CtrlStack中的根本原因分析仪表板的因果图被输入到PromptOps中,以进行故障排除和解决,如下所述。

下面是一个根本原因分析面板的随意图形示例。

用ChatGPT破解K8s难题

有了这个,我们提示PromptOps解释这个图。以下是PromptOps的回应:

PromptOps>以下是对图形的解释: 该图显示了Kubernetes pod中错误的根本原因。该错误是由pod映像中的更改引起的,这些更改类似于Kubernetes pod_error度量中的更改。该错误也类似于在kubernetes_ptime和kubernetes_pod_mem_usage度量中发现的拐点,以及node1中的拓扑变化。 该图显示了kubernetes_po_error更改的根本原因。有三个见解。首先是图像发生了变化。第二个是在度量kubernetes_ptime和kubernetes_pod_mem_usage中发现了拐点。第三个是节点1的拓扑结构发生了变化。

PromptOps返回了正常运行时间和内存使用指标之间的信息相关性,以及相关的拓扑变化。这些见解包括检查Kubernetes的更改事件、度量、资源使用情况和拓扑结构更改。基于这种自动事件调查,开发人员和操作员应该有足够的上下文来快速确定解决问题的下一步措施。

3、将ChatGPT与Change AI相结合,缩小技能差距

根据提供的例子,很明显,ChatGPT可以提供宝贵的帮助来缩小Kubernetes的技能差距。ChatGPT为DevOps团队提供了快速的见解和清晰的解释,以解决生产问题。这使初级运营商和初涉Kubernetes的开发人员能够独立学习技术并解决常见问题。

虽然ChatGPT的响应可以快速了解问题,但它需要特定于Kubernetes部署的不同问题的上下文信息。这就是Change AI的用武之地。Change AI平台提供了因果图,将资源容量、基础设施变化、配置变化、指标历史图表和事件时间表联系起来,以优化根本原因分析的路径。

基于ChatGPT的Kubernetes学习方法有可能显著提高DevOps的生产力,同时消除认知过载。通过将ChatGPT与Change AI相结合,团队可以将他们的Kubernetes技能提高一倍,并获得更好的可观察性。

原文链接:https://thenewstack.io/overcoming-the-kubernetes-skills-gap-with-chatgpt-assistance/返回搜狐,查看更多

责任编辑:

用ChatGPT破解K8s难题

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!