Mô tả công việc
Thiết kế và Xây dựng Hệ Thống Dữ Liệu:
Tạo lập hệ thống ETL (Extract, Transform, Load) để xử lý, làm sạch và chuyển đổi dữ liệu vào kho dữ liệu (data warehouse) hoặc các hệ thống lưu trữ dữ liệu khác.
Thiết kế, triển khai và duy trì các kiến trúc dữ liệu mạnh mẽ để thu thập, lưu trữ, và xử lý dữ liệu lớn từ nhiều nguồn khác nhau.
Xây dựng và Tối ưu Hóa Pipeline Dữ Liệu:
Xây dựng các pipeline dữ liệu tự động, linh hoạt để đảm bảo dữ liệu được cập nhật và có sẵn cho các phân tích theo thời gian thực hoặc batch.
Tối ưu hóa hiệu suất pipeline để đảm bảo xử lý dữ liệu nhanh chóng, hiệu quả và đáng tin cậy.
Quản lý Kho Dữ Liệu và Data Lake:
Thiết lập và quản lý kho dữ liệu (data warehouse) hoặc data lake, đảm bảo khả năng mở rộng và bảo mật dữ liệu.
Thực hiện các thao tác backup, phục hồi dữ liệu và tối ưu hóa việc truy xuất dữ liệu.
Đảm bảo Chất Lượng Dữ Liệu và Tính Toàn Vẹn:
Đảm bảo dữ liệu đáp ứng các tiêu chuẩn về chất lượng, tính toàn vẹn và độ chính xác.
Triển khai các công cụ và quy trình kiểm tra chất lượng dữ liệu để phát hiện và khắc phục các lỗi dữ liệu.
Phối Hợp và Hỗ Trợ Các Bộ Phận Khác:
Hỗ trợ các nhà khoa học dữ liệu và các phòng ban khác trong việc truy cập, xử lý và sử dụng dữ liệu.
Làm việc chặt chẽ với các bộ phận phát triển sản phẩm để đảm bảo hệ thống dữ liệu đáp ứng nhu cầu kinh doanh.
Yêu cầu công việc
Kinh nghiệm:
Tối thiểu 5 năm kinh nghiệm trong lĩnh vực Data Engineering, Khoa học Dữ liệu, hoặc các lĩnh vực liên quan.
Có kinh nghiệm với các hệ thống cơ sở dữ liệu lớn như SQL, NoSQL (MongoDB, Cassandra), và các hệ thống phân tán như Hadoop, Spark.
Kỹ năng lập trình:
Thành thạo Python, Java, Scala hoặc các ngôn ngữ lập trình liên quan đến xử lý dữ liệu.
Kinh nghiệm làm việc với các công cụ ETL như Apache NiFi, Talend, hoặc Airflow là một lợi thế.
Kỹ năng phân tích và xử lý dữ liệu lớn:
Thành thạo với các công cụ quản lý dữ liệu như Kafka, Flink hoặc các nền tảng streaming khác là điểm cộng.
Có khả năng làm việc với dữ liệu lớn và hệ thống phân tán.
Kiến thức về kho dữ liệu và hệ thống lưu trữ dữ liệu: Kinh nghiệm xây dựng và tối ưu hóa kho dữ liệu (data warehouse) hoặc data lake, như AWS Redshift, Snowflake, BigQuery, hoặc Azure Synapse.
Có khả năng tư duy hệ thống và phân tích các vấn đề phức tạp trong quá trình xử lý dữ liệu.
Quyền lợi
Lương rất cao và hấp dẫn theo thoả thuận
Tối thiểu 13 tháng lương/năm.
Có nhiều cơ hội được đào tạo, làm việc nâng cao trình độ và cơ hội thăng tiến.
Văn phòng làm việc chuyên nghiệp hạng A.
Có nhiều hoạt động bổ trợ tinh thần, du lịch...
Xét tăng lương 1- 2 lần/năm.
Môi trường làm việc thân thiện và có tính tương hỗ cao, ổn định lâu dài.
Có cơ hội làm việc tại nước ngoài.
Thưởng: Thưởng Tết, thưởng ngày lễ, thưởng giới thiệu nhân sự...
Chế độ phúc lợi toàn diện.
Cập nhật gần nhất lúc: 2024-11-18 21:50:03
Công ty TNHH MegaElec là doanh nghiệp chế xuất 100% vốn Hàn Quốc được thành lập năm 2019 và chính thức đi vào hoạt động giữa năm 2020. Công ty chuyên sản xuất và gia công các loại bảng mạch, bo mạch điện tử. Năm 2019, tập đoàn TSE đã quyết định đầu tư vào Việt Nam và thành lập công ty TNHH MegaElec với quy mô vốn đầu tư là 20 triệu đô, với sản phẩm chính là Bản mạch in PCB cao cấp.
Với mục tiêu trở thành nhà cung cấp bản mạch PCB cho các thiết bị kiểm tra chất bán dẫn hàng đầu thế giới, chúng tôi đã đầu tư hệ thống máy móc và công nghệ hiện đại nhất cho nhà máy MegaElec. Để hiện thực hóa điều đó chúng tôi đang tìm kiếm những ứng viên có tâm, có tầm gia nhập đội ngũ.