職位描述

職責描述:
1.負責rdma網絡相關的架構設計、配置、調試、性能優化以及持續穩定性運維保障;
2.主導訓練網絡系統的建設、優化和運維,保障業務系統不間斷運行;
3.負責對現訓練集群系統、網絡、容器、虛擬化維護;
4.負責突發事件的快速響應及故障排除;
任職要求:
崗位基本要求:
1、了解訓練網絡架構,熟悉主流llm訓練流程及數據流,pod規劃原則,有配置roce/ib環境經驗
2、熟悉 linux系統,主流虛擬化及容器相關技術,具備python編程能力,有網絡自動化項目者優先;了解k8s相關網絡模型及flunel\calico等主流網絡插件。
3、了解sdn相關場景,能較快學習不同廠商的sdn控制器使用,部署sdn以及排除sdn場景的網絡故障;熟悉云網絡相關知識,了解open stack。
4、精通網交換技術以及常用路由協議,如 ospf/is-is/bgp 等; 了解tcp/ip模型,熟悉相關協議棧,如ipv4/ipv6、tcp/udp、nat、dhcp、dns。熟悉常見vpn,如:ipsec/gre/ssl vpn的原理和使用;
5、了解sdwan工作原理,具備sdwan排障能力,具備企業sdwan整體規劃、部署經驗者優先;3.具有5年以上相關工作經驗,計算機或相關專業本科或以上學歷;
6.具備傳輸、網絡安全產品運營維護經驗者優先考慮;主流品牌路由、交換、防火墻、waf、漏掃、負載均衡器等操作、配置與管理;
7.有主流網絡設備廠商工作經驗,ccie證書、hcie證書者優先考慮;
8.有大型roce和ib運維經驗值優先;
工作地點
地址:淮安
