Mô tả công việc
Thiết kế và Xây dựng Hệ Thống Dữ Liệu:
Tạo lập hệ thống ETL (Extract, Transform, Load) để xử lý, làm sạch và chuyển đổi dữ liệu vào kho dữ liệu (data warehouse) hoặc các hệ thống lưu trữ dữ liệu khác.
Thiết kế, triển khai và duy trì các kiến trúc dữ liệu mạnh mẽ để thu thập, lưu trữ, và xử lý dữ liệu lớn từ nhiều nguồn khác nhau.
Xây dựng và Tối ưu Hóa Pipeline Dữ Liệu:
Xây dựng các pipeline dữ liệu tự động, linh hoạt để đảm bảo dữ liệu được cập nhật và có sẵn cho các phân tích theo thời gian thực hoặc batch.
Tối ưu hóa hiệu suất pipeline để đảm bảo xử lý dữ liệu nhanh chóng, hiệu quả và đáng tin cậy.
Quản lý Kho Dữ Liệu và Data Lake:
Thiết lập và quản lý kho dữ liệu (data warehouse) hoặc data lake, đảm bảo khả năng mở rộng và bảo mật dữ liệu.
Thực hiện các thao tác backup, phục hồi dữ liệu và tối ưu hóa việc truy xuất dữ liệu.
Đảm bảo Chất Lượng Dữ Liệu và Tính Toàn Vẹn:
Đảm bảo dữ liệu đáp ứng các tiêu chuẩn về chất lượng, tính toàn vẹn và độ chính xác.
Triển khai các công cụ và quy trình kiểm tra chất lượng dữ liệu để phát hiện và khắc phục các lỗi dữ liệu.
Phối Hợp và Hỗ Trợ Các Bộ Phận Khác:
Hỗ trợ các nhà khoa học dữ liệu và các phòng ban khác trong việc truy cập, xử lý và sử dụng dữ liệu.
Làm việc chặt chẽ với các bộ phận phát triển sản phẩm để đảm bảo hệ thống dữ liệu đáp ứng nhu cầu kinh doanh.
Yêu cầu công việc
Kinh nghiệm:
Tối thiểu 5 năm kinh nghiệm trong lĩnh vực Data Engineering, Khoa học Dữ liệu, hoặc các lĩnh vực liên quan.
Có kinh nghiệm với các hệ thống cơ sở dữ liệu lớn như SQL, NoSQL (MongoDB, Cassandra), và các hệ thống phân tán như Hadoop, Spark.
Kỹ năng lập trình:
Thành thạo Python, Java, Scala hoặc các ngôn ngữ lập trình liên quan đến xử lý dữ liệu.
Kinh nghiệm làm việc với các công cụ ETL như Apache NiFi, Talend, hoặc Airflow là một lợi thế.
Kỹ năng phân tích và xử lý dữ liệu lớn:
Thành thạo với các công cụ quản lý dữ liệu như Kafka, Flink hoặc các nền tảng streaming khác là điểm cộng.
Có khả năng làm việc với dữ liệu lớn và hệ thống phân tán.
Kiến thức về kho dữ liệu và hệ thống lưu trữ dữ liệu: Kinh nghiệm xây dựng và tối ưu hóa kho dữ liệu (data warehouse) hoặc data lake, như AWS Redshift, Snowflake, BigQuery, hoặc Azure Synapse.
Có khả năng tư duy hệ thống và phân tích các vấn đề phức tạp trong quá trình xử lý dữ liệu.
Quyền lợi
Lương rất cao và hấp dẫn theo thoả thuận
Tối thiểu 13 tháng lương/năm.
Có nhiều cơ hội được đào tạo, làm việc nâng cao trình độ và cơ hội thăng tiến.
Văn phòng làm việc chuyên nghiệp hạng A.
Có nhiều hoạt động bổ trợ tinh thần, du lịch...
Xét tăng lương 1- 2 lần/năm.
Môi trường làm việc thân thiện và có tính tương hỗ cao, ổn định lâu dài.
Có cơ hội làm việc tại nước ngoài.
Thưởng: Thưởng Tết, thưởng ngày lễ, thưởng giới thiệu nhân sự...
Chế độ phúc lợi toàn diện.
Cập nhật gần nhất lúc: 2024-11-18 21:50:03
Phú Minh Teck (PMT) là Công ty công nghệ cung cấp các dịch vụ tư vấn, triển khai giải pháp phần mềm trong nhiều lĩnh vực cho các tổ chức, doanh nghiệp trong nước và quốc tế. PMT luôn tiên phong đổi mới, sáng tạo với mong muốn góp phần nâng cao vị thế của Việt Nam trên bản đồ công nghệ thông tin toàn cầu.
Là một đối tác cung cấp dịch vụ CNTT tin cậy, PMT luôn mong muốn trở thành nguồn lực chính trong kỷ nguyên chuyển đổi số, cung cấp các công nghệ tiên tiến và dịch vụ xuất sắc có tác động đáng kể đến các ngành công nghiệp, xã hội và nền kinh tế Việt Nam cũng như Thế giới.
PMT cũng thúc đẩy một văn hóa làm việc coi trọng sự sáng tạo, tốc độ và cam kết uy tín cao nhất. Đội ngũ chuyên gia và nhân sự của PMT đông đảo, có kỹ năng để đảm bảo luôn thích ứng với những sự thay đổi về công nghệ mới, xu hướng mới trong tương lai.