♬水星 摩羯windows
你可以提条件,但不可以不接受!
关注数: 49 粉丝数: 211 发帖数: 7,955 关注贴吧数: 63
给想学运维,想进入这个行业的人一点建议 最近天天刷到有人问运维就业前景、薪资水平、学习路线、培训相关的路线,作为一个十年的老运维,给解答一下,纯个人主管看法,但是10年经验,我自认为作为老油条,我提的建议肯定是有用的,就仁者见仁智者见智吧。 第一点:运维就业前景,这个要分情况,如果你没有好的学历(至少要统招本科)和人脉,那可能你的天花板就到我这了,甚至现在的就业环境都达不到我这种地步了,我当年入职的时候,是不怎么看学历的,会linux基础就差不多能入职了,但现在投简历,学历不达标可能直接都到不到面试那一步。但要说还能不能干?答案是肯定的,因为总有脏活累活需要人,可以先从这些脏活累活入手,先入行,然后再一边工作一边学习提升自己。 第二点:薪资水平,这点和程序员其实一样,跨度很大,底层的桌面运维在北京也就4-8k,初中级的10-20k,高级点的20K以上,薪资这个东西和面试一样,看运气,我一个做网络的小伙伴,上一家网络运维8k,直接跳槽到20k,他自己也惊呆了。 第三点:学习路线,也是我最想说的,运维这行业方向很杂,小到桌面运维、大到SRE运维都叫运维,甚至网络运维也可以归纳进来,这块又细分很多,比如idc、虚拟化、容器、存储、网络、应用等等。这里就不提网络了,因为我不咋会,就会配置路由划个VLAN就不献丑了,主要说下系统,linux肯定是基础,常用的软件起码要会部署,这里列举几个常用的,如nginx、mysql、redis、kafka、nacos、tomcat等。因为不管是虚拟化也好、容器、业务也好都是基于这些中间件去运行或者在里面运行这些的中间件的,能够快速的部署、调优和排错才是运维的核心技能。后面要学devops、k8s、python、golang等进阶,看你工作内容和职业规划了。 最后在重点说下培训相关:现在的培训班大多都是割韭菜,培训的内容千篇一律,不是说没用,只能说完全不值票价,如果你真的实在是想进这一行,想花钱速成,我建议你先安装一个VMware Workstation,用一周的时间去B站找个视频,安装一个linux虚拟机,熟悉一下基础命令,能够按照文档自己部署一个samba服务,再考虑要不要花钱去培训,或者花钱找个大老师傅带,如果连这一步都做不到,建议不要浪费钱了,运维虽然简单,但也是有门槛的,samba作为最基础的linux服务,基本上钻研钻研就能上手搭建起来,如果搭建不起来要么天赋真的不行,要么就无法坚持学习,真的不建议花冤枉钱,运维可能不需要学的有多精,但要学的很多很杂,需要一直保持学习的心才能成才。 以上,简单的说了几句,说的内容并不详细,可能有点片面,希望能帮到一些小白吧。
技术交流,如何避免ingress-nginx触发reload导至长连接中断 最近在甲方驻场的时候甲方esb网关那边反馈在开市时间点网关访问我们信创k8s集群ingress域名出现了一波502,而且是所有域名都有出现,通过查看ingress日志确实是一些502记录,request_time和upstream_response_time时间一致,开始怀疑是不是开市的时候,服务器压力大导致后端的pod超时了,但是网关代理过来的域名都超时了,也不太可能所有的pod都有问题,只好抓包分析了一波。 通过抓包分析得出结论网关访问ingress过程中,ingress主动reset了连接,怀疑ingress是不是触发了reload,翻了一下历史日志,果然在触发502的时间点,ingress-nginx有一条reload记录,赶紧登录到集群,get ingress找到了一条ingress变更时间和502时间一致,可以判定用户修改了ingress配置,导致了ingress-nignx-controller触发了reload机制。 因为我们是云平台,允许用户自己增删改查ingress资源,且有差不多300多个用户在使用,如果频繁的出现reload,会变得不可控,于是我们查询了一些相关文档,也问了一下deepseek,想通过配置nginx优雅退出来进行缓解,ingress默认的时间是240s,尝试改到600s ,在测试环境进行压测,长连接还是会触发502,尝试多次调整keepalive和time_out相关配置,进行压测,均无法做到优雅关闭。和甲方客户进行了反馈,是不是可以采用其他方案,将ingress-nginx替换成envoy ingress,甲方领导反馈只有长连接会触发,且生产环境变更并不频繁,暂时不考虑替换方案。在群里f发布了公告不允许开市时间操作之后就搁置了。 不知道各位大佬在生产环境中有没有遇到过类似的问题。解决方案是什么。
1 下一页