因NFS服务器网络变动.导致k8sPod无法删除也无法启动
TL;DR:测试ELK容器挂载共享NFS存储snapshot备份, 因网络策略调整导致nfs服务器无法访问.
执行df命令卡住无法检查nfs状态, 在node上直接umount -lf 并通过docker登陆pod对应的容器 umount -lf后 df正常.
临时修改yaml文件, 注释nfs挂载和pvc定义后重新部署节点.
TL;DR:测试ELK容器挂载共享NFS存储snapshot备份, 因网络策略调整导致nfs服务器无法访问.
执行df命令卡住无法检查nfs状态, 在node上直接umount -lf 并通过docker登陆pod对应的容器 umount -lf后 df正常.
临时修改yaml文件, 注释nfs挂载和pvc定义后重新部署节点.
问题:
ES 6.8 开始kibana最佳实践改为: 一个kibana只连接一个coordinating only node. 然后在kibana之间做负载均衡.
问题: 磁盘容量分配错
/var/lib/docker占据了所有磁盘, 缩减 /var/lib/docker到20G, 容量分配到其他分区
解决ansible ubuntu主机上hostnamectl失败问题
本问题由我组员李卓找到解决办法, 特此感谢.
为什么我在docker上的JAVA程序看到的CPU这么少?
1. 问题:
docker 运行的 elasticsearch 6.6.1 压测性能非常不好, 后发现es的线程池数设置为1, available processor也为1,并且修改此参数后仍然压不上去.
awx中批量导入主机
环境: AWX 3.0.1.0 , ansible 2.7.7 ,docker安装
从gci同步k8s镜像的脚本
简单实现,请先自行安装kubeadm, 然后运行本脚本即可.
请自行保证和gcr的网络连接可用.
未经优化的kafka+k8s+rook.io暴力压测试验 1
测试人员
本测试由我团队k8s和kafka技术支持-boxuan666完成
我一般很少写项目介绍, 有点硬推广的意思. aws这个项目确实是解决了我们一直以来的痛点 — 一套简单的生产可用的开源es, 提供基本的用户认证和角色, 内置基本监控.
问题:
近期因调整堡垒机权限,对iptables进行调整,手贱执行了iptables -F. 所有k8s的规则很快就被kubelet加回来了, 也就每当个事.
晚上跑cicd的时候大部分容器无法拉代码, 只有少数容器可以. 后来发现和gitlab不通,初期判断是因为iptables的问题,几次调整以后还是不行.观察了一下发现所有能拉代码的全是host网络的容器. 这时才想到会不会是iptables的问题,检查发现果然是docker的转发规则全被清空了.
Harbor 1.2.2 无法获得镜像列表
现象
老旧的harbor 1.2.2界面看不到镜像了.harbor镜像在界面上总是处于loading状态,因长期CI/CD流水线生产了很多镜像,导致前台页面无返回.后台通过curlAPI获取查询镜像的tag,命令如下:
ntpq connection refused
转自 https://unix.stackexchange.com/questions/345778/why-does-ntpq-pn-report-connection-refused
harbor 1.7 helm ingress 对接lvs nginx报错集锦
1. 没有强制将http转https
因为http和https同时存在并转向ingress,造成从https登陆但是后续线程拉取的时候走了http(或者倒过来)
Rancher 1.6 删除节点
CKA认证备考指南
什么是CKA认证
CKA认证,全称Certified Kubernetes Administrator , 由Cloud Native Computing Foundation(CNCF)组织,考试目标是确保kubernetes的管理员有足够的管理kubernetes技能和知识。
详细请关注:https://www.cncf.io/certification/expert/CKA/