小红书
基础架构-云原生方向
集群 CPU 利用率均值达 45% ,揭秘小红书规模化混部技术实践_cpu_小红书技术 REDtech_InfoQ 写作社区
岗位描述
小红书基础架构云原生团队致力于通过云原生技术和不断的技术创新突破,帮助广大研发提升研发和运维效率,让研发把更多精力放在创造业务价值上去。团队贴近小红书丰富的业务场景,以容器和 K8s 为突破口,以分布式、微服务、ServiceMesh、Serverless 为切入点布局产品技术,建设具备 GitOps、Infrastructure As Code、自动弹性的 Serverless 平台,和各种云产品深度合作,让研发用“云”变得前所未有的简单;同时团队也致力于引领公司研发团队走向云原生的开发方式,总结和布道先进的云原生研发模式,推进云原生前沿技术落地。
岗位要求
-
本科及以上学历,计算机、软件工程、数学、电子工程、通信等相关专业;
-
3 年以上行业大型互联网应用或集团型企业应用的架构、平台开发等经验,精通 Go 或 Java,有有国内外知名云计算团队的工作经历者优先;
-
对 K8s、Serverless 技术充满热情,熟悉云原生领域头部项目(Kubernetes、Service Mesh、FaaS 等)API 层、模型层及关联规范、标准,熟悉其典型场景及实现原理;熟悉 Kubernetes apiserver、operator 机制、kubebuilder,项目 commiter 优先;
-
有 K8s operator 相关研发经验,熟悉容器调度,适配过分布式缓存、消息队列、数据库等产品者优先;
-
具备高度的抽象设计能力,对技术和业务有前瞻性的思考,思路清晰且表达能力较好,具备独立的分析和设计实现能力;以及具备良好的编码风格,追求优雅设计和代码质量。
【REDstar】云原生开发方向
职位类型: 基础后端
工作地点: 北京市,上海市
项目: REDstar 顶尖人才计划
工作职责
- 参与云原生基础设施的规划、设计和建设,提高系统的可扩展性、稳定性和可用性。
- 负责云原生基础设施的自动化部署和运维。
- 参与小红书面向混合云-多集群的云原生 Serverless Infra 底座的建设。
- 参与云原生高级工作负载、多集群应用分发与调度、弹性能力相关组件与系统的规划和设计开发。
- 跟踪云原生技术的最新发展,研究新技术和工具,并将其应用于实际工作中。
任职资格
- 统招本科及以上学历,计算机、软件工程等相关专业优先。
- 至少精通一门编程语言,例如 Go、Java、Python、C/C++。
- 深刻理解计算机数据结构和算法设计,具备对云原生相关技术如 Kubernetes、Docker/Containerd 的了解和实践经验。
- 对于互联网技术有好奇心和热 情,有良好的沟通能力和团队协同能力,善于独立思考并反思总结。
加分项
- 熟悉大数据、机器学习相关框架,有开源社区运作、云原生相关的实践经验者优先。
云原生高级开发工程师
基本信息
- 工作地点:上海市,北京市,杭州市
- 工作经验:不限
- 学历要求:本科及以上
- 更新时间:2024-11-04
工作职责
- 负责公司容器调度平台的架构设计和核心功能开发,包括容器资源管理、调度优化、弹性伸缩等模块。
- 设计和实现在线与离线任务的混部调度方案,优化集群资源的整体利用率,实现计算、存储和网络资源的高效调度。
- 针对不同业务场景,研究并改进 Kubernetes 调度算法,包括任务优先级、抢占机制、节点选择等,提升集群的资源分配效率和稳定性。
- 与多集群管理平台、资源隔离、QoS 管理等模块协同工作,确保在复杂场景下的资源调度策略具备高可用性和可扩展性。
- 跟踪云原生生态的最新发展趋势,研究并应用新技术以提升系统性能和调度灵活性。
- 支持系统的性能监控与 故障诊断,参与系统优化和技术问题的快速解决,保障系统的高效稳定运行。
任职资格
- 计算机科学、软件工程等相关专业本科及以上学历,3 年以上容器、Kubernetes 或相关分布式系统开发经验。
- 熟练掌握 Kubernetes 核心组件的原理和开发,具备调度器(Scheduler)相关模块的开发经验,有调度算法优化项目经验优先。
- 熟悉大规模容器集群的资源管理和在离线混部调度机制,了解不同业务负载对计算、存储和网络资源的需求,能有效设计混部策略。
- 精通 Go 或 C++ 编程,具有良好的代码风格和系统架构设计能力,能进行复杂系统的代码开发和调试。
- 熟悉容器技术栈(如 Docker、containerd),有 Linux 系统内核、资源控制(如 cgroups)、网络虚拟化等知识。
- 有云原生项目(如 Koordinator、Volcano、OpenKruise)或自定义调度器的开发经验者优先。
- 具备较强的学习能力和分析问题的能力,能够快速理解并应用新技术。
- 优秀的团队合作与沟通能力,善于跨部门协作推进项目落地。
加分项
- 参与或主导过大型分布式系统/高性能计算平台的架构设计。
- 在云原生社区(如 CNCF 开源项目)有贡献,或发表过相关技术博客/论文。
- 有 Prometheus、Thanos 等监控系统的运维经验,能基于实时数据进行资源调度的优化。