Navigos Search is seeking System Operations Engineer to work with global development teams to install, integrate, and secure the hardware and software components of various systems of the company or supply, continuously automating this process.
Join the team you will have the opportunities to:
- Working with huge system, servers: operating clusters of hundreds GPU/NPUs for development
- Learning and collaborating in a global expert team - using English daily
- Great package benefits with full social insurance package from day 1
Responsibilities
- Build/manage system S/W components such as GPU/NPU device drivers, communication libraries, directory services, distributed file systems, AI acceleration, and object storage for clustering.
- Automate S/W provisioning processes through IaC tools such as Ansible and Terraform or programming.
- Build/manage container orchestration tools such as Kubernetes (K8s) in clusters.
- Analyze and resolve the causes of various S/W or H/W errors.
- Provide overall management and technical consulting for Moreh's customer operating infrastructure.
- Install/operate various equipment in data centers, including CPU/GPU/NPU servers, high speed interconnection networks such as InfiniBand and RoCE, storage servers, and firewalls.
Qualifications
- 3+ years of experience operating and managing Linux-based cluster systems
- Extensive understanding of various H/W and S/W components of computer systems.
- Knowledge of Docker and Kubernetes, and experience building a Kubernetes cluster oneself.
- Experience in analyzing various logs and operating monitoring solutions for large-scale IT infrastructure.
- Experience in developing high-availability (HA) S/W and related knowledge.
- Experience in installing and maintaining Linux systems at an IT system/solution distributor or reseller.
- Fluent English conversation skills (Writing & Reading)
- Excellent logical thinking and problem-solving skills.
Preferential
- Bachelor's/Graduate degree in Computer Engineering or related field. Experience installing, configuring, and operating InfiniBand networks. Python/C Programming Skills.
- Experience in building and managing cluster systems, especially GPU clusters.
- Having experience operating/monitoring large-scale cluster (up to hundreds nodes).
- Fluent Chinese conversation. Fluent Korean conversation.
For more information, feel free to reach out to Ms. Nhung via:
Telegram/Skype: thuynhungng
Phone/Zalo/Whatsapp: 0973723298
Công ty TNHH Công nghệ Asilla Việt Nam được thành lập với mục tiêu xây dựng các sản phẩm dựa trên công nghệ AI hỗ trợ con người trong việc giám sát hành vi bất thường qua hình ảnh camera, thay thế con người giám sát 24/7. Công nghệ này sử dụng các mô hình học máy để dự đoán tư thế của con người (pose estimation) từ hình ảnh hoặc video bằng cách dự đoán các khớp trên cơ thể người (keypoints), theo đó, hệ thống sẽ nhận diện được hành vi của con người.
Chính sách bảo hiểm
- Được hưởng các chế độ bảo hiểm : BHYT, BHXH, BHTN
- Hưởng quyền lợi bảo hiểm 24/7
Các hoạt động ngoại khóa
- Du lịch hàng năm
- Team building theo quý
- Các hoạt động vui chơi, giải trí, ca hát thường xuyên
- Thể thao: Đá bóng, bóng chuyền,..
Lịch sử thành lập
- Công ty được thành lập năm 2015
Mission
Các mục tiêu chúng tôi đặt ra cho chương trình bền vững phản ánh trực tiếp tầm nhìn của chúng tôi về việc đảm bảo một tương lai lành mạnh hơn cho ngành
Review Asilla
1 Start up đáng để trải nghiệm (IT)
Nơi làm việc hiệu quả và vui vẻ (GL)
Phúc lợi tăng, môi trường lành mạnh (RV)