Navigos Search is seeking System Operations Engineer to work with global development teams to install, integrate, and secure the hardware and software components of various systems of the company or supply, continuously automating this process.
Join the team you will have the opportunities to:
- Working with huge system, servers: operating clusters of hundreds GPU/NPUs for development
- Learning and collaborating in a global expert team - using English daily
- Great package benefits with full social insurance package from day 1
Responsibilities
- Build/manage system S/W components such as GPU/NPU device drivers, communication libraries, directory services, distributed file systems, AI acceleration, and object storage for clustering.
- Automate S/W provisioning processes through IaC tools such as Ansible and Terraform or programming.
- Build/manage container orchestration tools such as Kubernetes (K8s) in clusters.
- Analyze and resolve the causes of various S/W or H/W errors.
- Provide overall management and technical consulting for Moreh's customer operating infrastructure.
- Install/operate various equipment in data centers, including CPU/GPU/NPU servers, high speed interconnection networks such as InfiniBand and RoCE, storage servers, and firewalls.
Qualifications
- 3+ years of experience operating and managing Linux-based cluster systems
- Extensive understanding of various H/W and S/W components of computer systems.
- Knowledge of Docker and Kubernetes, and experience building a Kubernetes cluster oneself.
- Experience in analyzing various logs and operating monitoring solutions for large-scale IT infrastructure.
- Experience in developing high-availability (HA) S/W and related knowledge.
- Experience in installing and maintaining Linux systems at an IT system/solution distributor or reseller.
- Fluent English conversation skills (Writing & Reading)
- Excellent logical thinking and problem-solving skills.
Preferential
- Bachelor's/Graduate degree in Computer Engineering or related field. Experience installing, configuring, and operating InfiniBand networks. Python/C Programming Skills.
- Experience in building and managing cluster systems, especially GPU clusters.
- Having experience operating/monitoring large-scale cluster (up to hundreds nodes).
- Fluent Chinese conversation. Fluent Korean conversation.
For more information, feel free to reach out to Ms. Nhung via:
Telegram/Skype: thuynhungng
Phone/Zalo/Whatsapp: 0973723298
Công ty TNHH IIJ Global Solutions Việt Nam là công ty con chung của IIJ và IIJ Global Solutions Japan. Tại tập đoàn IIJ, chúng tôi nỗ lực cung cấp cho các công ty Nhật Bản đang mở rộng hoạt động kinh doanh sang thị trường Việt Nam những dịch vụ có chất lượng cao như họ đã quen thuộc ở Nhật Bản. Bằng cách cộng tác với ISP địa phương, chúng tôi có thể cung cấp các dịch vụ như dịch vụ đám mây, với nhiều giá trị gia tăng hơn nữa
Chính sách bảo hiểm
- Tập đoàn tham gia bảo hiểm sức khỏe nâng cao cho các nhân viên với hạn mức lên tới 500 triệu đồng/ năm, không những tham gia cho bản thân nhân viên mà còn tham gia cả cho người thân
Các hoạt động ngoại khóa
- Teambuilding hàng năm
- CLB yoga, bóng đá
- Talkshow phát triển bản thân
Lịch sử thành lập
-
Được thành lập vào năm 2016
Mission
- Với sứ mệnh được tuyên ngôn là “Hướng tới con người và vì con người”, IIJ luôn chú trọng phát triển nguồn nhân lực thông qua việc bồi dưỡng, đào tạo; trao quyền; tạo cơ hội thăng tiến và thể hiện bản thân cho mỗi nhân viên để họ có thể phát huy năng lực và phát triển toàn diện về mọi mặt. Nhiều chương trình đào tạo kỹ năng nghiệp vụ và phát triển bản thân được doanh nghiệp tổ chức. Các nhân viên mới sẽ được đào tạo về kiến thức chuyên môn từ những giảng viên nội bộ có nhiều năm kinh nghiệm trong nghề.