Navigos Search is seeking System Operations Engineer to work with global development teams to install, integrate, and secure the hardware and software components of various systems of the company or supply, continuously automating this process.
Join the team you will have the opportunities to:
- Working with huge system, servers: operating clusters of hundreds GPU/NPUs for development
- Learning and collaborating in a global expert team - using English daily
- Great package benefits with full social insurance package from day 1
Responsibilities
- Build/manage system S/W components such as GPU/NPU device drivers, communication libraries, directory services, distributed file systems, AI acceleration, and object storage for clustering.
- Automate S/W provisioning processes through IaC tools such as Ansible and Terraform or programming.
- Build/manage container orchestration tools such as Kubernetes (K8s) in clusters.
- Analyze and resolve the causes of various S/W or H/W errors.
- Provide overall management and technical consulting for Moreh's customer operating infrastructure.
- Install/operate various equipment in data centers, including CPU/GPU/NPU servers, high speed interconnection networks such as InfiniBand and RoCE, storage servers, and firewalls.
Qualifications
- 3+ years of experience operating and managing Linux-based cluster systems
- Extensive understanding of various H/W and S/W components of computer systems.
- Knowledge of Docker and Kubernetes, and experience building a Kubernetes cluster oneself.
- Experience in analyzing various logs and operating monitoring solutions for large-scale IT infrastructure.
- Experience in developing high-availability (HA) S/W and related knowledge.
- Experience in installing and maintaining Linux systems at an IT system/solution distributor or reseller.
- Fluent English conversation skills (Writing & Reading)
- Excellent logical thinking and problem-solving skills.
Preferential
- Bachelor's/Graduate degree in Computer Engineering or related field. Experience installing, configuring, and operating InfiniBand networks. Python/C Programming Skills.
- Experience in building and managing cluster systems, especially GPU clusters.
- Having experience operating/monitoring large-scale cluster (up to hundreds nodes).
- Fluent Chinese conversation. Fluent Korean conversation.
For more information, feel free to reach out to Ms. Nhung via:
Telegram/Skype: thuynhungng
Phone/Zalo/Whatsapp: 0973723298
Công ty Cổ phần Công nghệ Qi (Qi Technologies) là một công ty có năng lực trong nghiên cứu, triển khai và ứng dụng công nghệ cho nhiều phân khúc khách hàng khác nhau. Qi Technologies hoạt động với phương châm và mục tiêu không ngừng đẩy mạnh nghiên cứu ứng dụng các giải pháp công nghệ tiên tiến, tối ưu song song với việc cung cấp dịch vụ chuyên nghiệp, phù hợp với nhu cầu và mang lại giá trị sử dụng cao nhất cho hoạt động điều hành, sản xuất, kinh doanh của khách hàng.
Chính sách bảo hiểm
- Được hưởng các chế độ bảo hiểm : BHYT, BHXH, BHTN
- Hưởng quyền lợi bảo hiểm 24/7
Các hoạt động ngoại khóa
- Du lịch hàng năm
- Team building theo quý
- Các hoạt động vui chơi, giải trí, ca hát thường xuyên
- Thể thao: Đá bóng, bóng chuyền,..
Lịch sử thành lập
- Công ty được thành lập năm 2007
Mission
Các mục tiêu chúng tôi đặt ra cho chương trình bền vững phản ánh trực tiếp tầm nhìn của chúng tôi về việc đảm bảo một tương lai lành mạnh hơn cho ngành