Navigos Search is seeking System Operations Engineer to work with global development teams to install, integrate, and secure the hardware and software components of various systems of the company or supply, continuously automating this process.
Join the team you will have the opportunities to:
- Working with huge system, servers: operating clusters of hundreds GPU/NPUs for development
- Learning and collaborating in a global expert team - using English daily
- Great package benefits with full social insurance package from day 1
Responsibilities
- Build/manage system S/W components such as GPU/NPU device drivers, communication libraries, directory services, distributed file systems, AI acceleration, and object storage for clustering.
- Automate S/W provisioning processes through IaC tools such as Ansible and Terraform or programming.
- Build/manage container orchestration tools such as Kubernetes (K8s) in clusters.
- Analyze and resolve the causes of various S/W or H/W errors.
- Provide overall management and technical consulting for Moreh's customer operating infrastructure.
- Install/operate various equipment in data centers, including CPU/GPU/NPU servers, high speed interconnection networks such as InfiniBand and RoCE, storage servers, and firewalls.
Qualifications
- 3+ years of experience operating and managing Linux-based cluster systems
- Extensive understanding of various H/W and S/W components of computer systems.
- Knowledge of Docker and Kubernetes, and experience building a Kubernetes cluster oneself.
- Experience in analyzing various logs and operating monitoring solutions for large-scale IT infrastructure.
- Experience in developing high-availability (HA) S/W and related knowledge.
- Experience in installing and maintaining Linux systems at an IT system/solution distributor or reseller.
- Fluent English conversation skills (Writing & Reading)
- Excellent logical thinking and problem-solving skills.
Preferential
- Bachelor's/Graduate degree in Computer Engineering or related field. Experience installing, configuring, and operating InfiniBand networks. Python/C Programming Skills.
- Experience in building and managing cluster systems, especially GPU clusters.
- Having experience operating/monitoring large-scale cluster (up to hundreds nodes).
- Fluent Chinese conversation. Fluent Korean conversation.
For more information, feel free to reach out to Ms. Nhung via:
Telegram/Skype: thuynhungng
Phone/Zalo/Whatsapp: 0973723298
ScutiJSC - Công ty gia công CNTT Nhật Bản đáng tin cậy của bạn có trụ sở tại Việt Nam, phục vụ thị trường tiêu chuẩn cao như Nhật Bản nhưng với giá cả rất phải chăng. Tại Scuti, chúng tôi vượt xa lĩnh vực gia công CNTT. Chúng tôi là đối tác đáng tin cậy của bạn trong việc phát triển phần mềm tùy chỉnh và tăng cường nhân sự, xuất sắc trong việc phát triển PHP và tích hợp ChatGPT. Với thành tích đã được chứng minh trong các ngành như Giáo dục, Y tế, Truyền thông & Giải trí, Hậu cần, Thương mại điện tử, Bất động sản và Nhà tích hợp hệ thống, chúng tôi cung cấp các giải pháp tuyệt vời phù hợp với nhu cầu của bạn.
Chính sách bảo hiểm
- Bảo hiểm sức khỏe & tai nạn PVI Premium;
- Bảo hiểm xã hội
Các hoạt động ngoại khóa
- Du lịch hàng năm
- Zumba
- Bóng đá
- Bóng bàn
- Cầu lông
- Teambuilding
Lịch sử thành lập
- ScutiJSC được thành lập vào năm 2015 với trụ sở chính đặt tại cả Việt Nam và Nhật Bản.
Mission
Định hướng phát triển, không ngừng đổi mới, sáng tạo để kiến tạo hệ sinh thái các sản phẩm dịch vụ đẳng cấp, góp phần nâng cao chất lượng cuộc sống của mọi người và nâng tầm vị thế của thương hiệu Việt trên trường quốc tế.
Review SCUTI
Chưa thấy một manager nào thật sự đủ năng lực. (RV)
Công ty trả 14 tháng lương (RV)
Công ty cũng năng động, hay có các hoạt động ngoài trời(RV)