helm激活集群 一段时间就失联

  • Choerodon平台版本: 0.13.0

  • 遇到问题的执行步骤:
    [root@by-deploy01 ~]# kubectl get pod -n choerodon
    NAME READY STATUS RESTARTS AGE
    choerodon-cluster-agent-dev-test-7d449f795b-xjd29 1/1 Running 0 20h
    [root@by-deploy01 ~]#

  • 文档地址:

  • 环境信息(如:节点信息):
    k8s 1.11.0 helm 2.10.0

  • 报错日志:

  • 原因分析:

    提出您分析问题的过程,以便我们能更准确的找到问题所在
    删除pod 重新生成 又能连接了
    [root@by-deploy01 ~]# kubectl logs choerodon-cluster-agent-dev-test-7d449f795b-gdsnp -f -n choerodon
    I0131 14:19:20.761029 7 agent.go:123] KubeClient init success.
    I0131 14:19:20.761085 7 agent.go:125] Starting connect to tiller…
    I0131 14:19:20.761404 7 agent.go:127] Tiller connect success
    I0131 14:19:20.761421 7 agent.go:287] check k8s role binding…
    I0131 14:19:20.812364 7 agent.go:293] k8s role binding succeed.
    I0131 14:19:20.812523 7 agent.go:208] kubectl /usr/local/bin/kubectl
    I0131 14:19:20.812540 7 client.go:79] Started agent
    I0131 14:19:21.598678 7 sync.go:178] kubectl apply -f - , took 786.114452ms, err: , output: customresourcedefinition “c7nhelmreleases.choerodon.io” configured
    I0131 14:19:21.598895 7 worker.go:143] get command: cluster:2/init_agent
    I0131 14:19:21.598978 7 worker.go:143] get command: inter:inter/upgrade_cluster
    I0131 14:19:21.599371 7 controller.go:108] Starting controllers for envs []
    I0131 14:19:21.599438 7 client.go:173] send response key cluster:2, type init_agent_succeed
    I0131 14:19:21.599748 7 controller_utils.go:1019] Waiting for caches to sync for endpoint controller
    E0131 14:19:21.601258 7 error.go:10] rpc error: code = Unavailable desc = transport is closing
    I0131 14:19:21.601314 7 client.go:173] send response key inter:inter, type upgrade_cluster_failed
    I0131 14:19:21.699987 7 controller_utils.go:1026] Caches are synced for endpoint controller
    I0131 14:19:21.700287 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:21.700402 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:21.701519 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:21.701583 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:21.701908 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:21.701968 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:21.702007 7 client.go:173] send response key env:choerodon-test, type resource_sync
    I0131 14:19:27.700192 7 client.go:173] send response key none:none, type namespace_update

  • 疑问:

    提出您对于遇到和解决该问题时的疑问
    我 helm 是开启 tls的 没关系吧???

请问一下这个集群k8s的版本是多少。

放假了吗,看到麻烦 指导下谢谢

1.11.0

看日志是由于Agent和集群版本没有兼容造成的。目前我们测试的最高的集群版本是1.10.12。更高的版本我们开工后会增加支持。可以暂时可以考虑安装1.10.12以及以下版本k8s。

目前我们公司都是1.12.x 了 有大概支持计划吗? 1.10.x 确实有点老了。

目前我们公司都是1.12.x 了 有大概支持计划吗? 1.10.x 确实有点老了。

近期我们已经开始进行相关的测试支持,多版本的支持我们会继续优化进行的

好的 有具体时间节点 麻烦及时通知下 因为打算这两个月在公司推c7n

好的 有具体时间节点 麻烦及时通知下 因为打算这两个月在公司推c7n

1.11.3 可以 麻烦核实下 没问题的话我升级下试试

麻烦看下 这是什么原因 集群激活一段时间就 未连接了
k8s 版本 1.11.3 helm v2.11.0

没有其他日志了吗,agent会重启吗

现在 可以了 估计是 helm 版本问题 我客户端是 2.9的