Navigos Search is seeking System Operations Engineer to work with global development teams to install, integrate, and secure the hardware and software components of various systems of the company or supply, continuously automating this process.
Join the team you will have the opportunities to:
- Working with huge system, servers: operating clusters of hundreds GPU/NPUs for development
- Learning and collaborating in a global expert team - using English daily
- Great package benefits with full social insurance package from day 1
Responsibilities
- Build/manage system S/W components such as GPU/NPU device drivers, communication libraries, directory services, distributed file systems, AI acceleration, and object storage for clustering.
- Automate S/W provisioning processes through IaC tools such as Ansible and Terraform or programming.
- Build/manage container orchestration tools such as Kubernetes (K8s) in clusters.
- Analyze and resolve the causes of various S/W or H/W errors.
- Provide overall management and technical consulting for Moreh's customer operating infrastructure.
- Install/operate various equipment in data centers, including CPU/GPU/NPU servers, high speed interconnection networks such as InfiniBand and RoCE, storage servers, and firewalls.
Qualifications
- 3+ years of experience operating and managing Linux-based cluster systems
- Extensive understanding of various H/W and S/W components of computer systems.
- Knowledge of Docker and Kubernetes, and experience building a Kubernetes cluster oneself.
- Experience in analyzing various logs and operating monitoring solutions for large-scale IT infrastructure.
- Experience in developing high-availability (HA) S/W and related knowledge.
- Experience in installing and maintaining Linux systems at an IT system/solution distributor or reseller.
- Fluent English conversation skills (Writing & Reading)
- Excellent logical thinking and problem-solving skills.
Preferential
- Bachelor's/Graduate degree in Computer Engineering or related field. Experience installing, configuring, and operating InfiniBand networks. Python/C Programming Skills.
- Experience in building and managing cluster systems, especially GPU clusters.
- Having experience operating/monitoring large-scale cluster (up to hundreds nodes).
- Fluent Chinese conversation. Fluent Korean conversation.
For more information, feel free to reach out to Ms. Nhung via:
Telegram/Skype: thuynhungng
Phone/Zalo/Whatsapp: 0973723298
Là công ty hàng đầu về các giải pháp CNTT trong phần mềm và ứng dụng Web. Chúng tôi cũng là thành viên của Tập đoàn NTT DATA, có hoạt động kinh doanh tại 42 quốc gia. Ban đầu là một phần của Tập đoàn NTT.
Công ty TNHH NTT DATA Việt Nam được thành lập năm 2008 và là công ty hàng đầu về giải pháp CNTT trong phần mềm và ứng dụng Web, chuyên ngành nghiên cứu, tư vấn và chuyển giao công nghệ về CNTT với hơn 190 nhân viên tại Việt Nam.
NTT DATA Việt Nam đang tìm kiếm những ứng viên đủ năng lực nhằm mở rộng kinh doanh. Nếu bạn có tài năng phát triển phần mềm và hiện đang tìm kiếm một công việc với:
• Tiêu chuẩn và quy trình phát triển
• Cơ hội đào tạo/tăng trưởng
• Cuộc sống làm việc chất lượng/Phúc lợi tốt
• Bảo hiểm y tế/Quỹ dự phòng
Review NTT DATA VIỆT NAM
Thực trạng công ty rất tệ, PM không có kỹ năng quản lý, Cty chẳng có người giỏi
Công ty đáng để gắn bó lâu dài. Chế độ làm thêm giờ trả lương hợp lý cho nhân viên.
Môi trường làm việc thân thiện, hòa đồng, sếp nice