0.14版本,安装后,添加集群一直失败,agent容器报异常

  • Choerodon平台版本: 0.14.0

  • 遇到问题的执行步骤: 平台安装好后,集群管理中添加集群,状态一直是未连接。

  • 文档地址:

  • 环境信息(如:节点信息):
    三个master,一个node的k8s集群。猪齿鱼部署在该集群,使用内网dns做域名解析。域名解析到其中一个master的内网ip上。

  • 报错日志:
    agent容器的异常日志:

  • 原因分析:

    提出您分析问题的过程,以便我们能更准确的找到问题所在
    agent与devops-service建立websocket服务错误,devops-service的域名(内网)和端口都是通的。
    不知道服务调用关系,所以又看了gitlab相关服务。
    gitlab-service 异常
    ,gitlab-ssh 的2289端口,通过devops域名可以Telnet。

  • 疑问:

    提出您对于遇到和解决该问题时的疑问
    配置参数中有哪些关键点?比如token,或者url,或者哪些参数漏掉了?什么时候做gitlab的oauth2
    认证比较好,我是在全部部署好之后做的,但是访问gitlab的域名,在跳出的choerodon界面登录,会报认证失败,这个正常吗?

Hi,进去到agent的pod中 看看能不能访问devops.pso.cn这个域名

可以ping通,curl http://devops.pso.cn/agent报错

,谢谢

把devops-service重启一下试试

可能是公司环境问题,在agent容器内部hosts中设置域名,貌似有戏

以gitlab为例,对应ingress如下


对应service如下

容器内部ping gitlab的域名得到的ip

实际dns server上gitlab域名对应的ip为某个master的内网ip 10.110.164.19*。
容器内的hosts中把域名指向master 的内网ip,就可正常访问。
结论,dns配置有问题,但不知道该如何正确配置。
另外容器内ping gitlab域名时得到的ip103.232.215.138是什么ip?

这个ip是你的dns服务器给的,建议你看下你的域名解析配置和内网中的DNS服务器配置

是否要在kubelet中指定我的内网dns server之后,重启pod?

你好,请尝试按照官网配置kube-dns

已解决,谢谢