Mô tả công việc
Thiết kế và Xây dựng Hệ Thống Dữ Liệu:
Tạo lập hệ thống ETL (Extract, Transform, Load) để xử lý, làm sạch và chuyển đổi dữ liệu vào kho dữ liệu (data warehouse) hoặc các hệ thống lưu trữ dữ liệu khác.
Thiết kế, triển khai và duy trì các kiến trúc dữ liệu mạnh mẽ để thu thập, lưu trữ, và xử lý dữ liệu lớn từ nhiều nguồn khác nhau.
Xây dựng và Tối ưu Hóa Pipeline Dữ Liệu:
Xây dựng các pipeline dữ liệu tự động, linh hoạt để đảm bảo dữ liệu được cập nhật và có sẵn cho các phân tích theo thời gian thực hoặc batch.
Tối ưu hóa hiệu suất pipeline để đảm bảo xử lý dữ liệu nhanh chóng, hiệu quả và đáng tin cậy.
Quản lý Kho Dữ Liệu và Data Lake:
Thiết lập và quản lý kho dữ liệu (data warehouse) hoặc data lake, đảm bảo khả năng mở rộng và bảo mật dữ liệu.
Thực hiện các thao tác backup, phục hồi dữ liệu và tối ưu hóa việc truy xuất dữ liệu.
Đảm bảo Chất Lượng Dữ Liệu và Tính Toàn Vẹn:
Đảm bảo dữ liệu đáp ứng các tiêu chuẩn về chất lượng, tính toàn vẹn và độ chính xác.
Triển khai các công cụ và quy trình kiểm tra chất lượng dữ liệu để phát hiện và khắc phục các lỗi dữ liệu.
Phối Hợp và Hỗ Trợ Các Bộ Phận Khác:
Hỗ trợ các nhà khoa học dữ liệu và các phòng ban khác trong việc truy cập, xử lý và sử dụng dữ liệu.
Làm việc chặt chẽ với các bộ phận phát triển sản phẩm để đảm bảo hệ thống dữ liệu đáp ứng nhu cầu kinh doanh.
Yêu cầu công việc
Kinh nghiệm:
Tối thiểu 5 năm kinh nghiệm trong lĩnh vực Data Engineering, Khoa học Dữ liệu, hoặc các lĩnh vực liên quan.
Có kinh nghiệm với các hệ thống cơ sở dữ liệu lớn như SQL, NoSQL (MongoDB, Cassandra), và các hệ thống phân tán như Hadoop, Spark.
Kỹ năng lập trình:
Thành thạo Python, Java, Scala hoặc các ngôn ngữ lập trình liên quan đến xử lý dữ liệu.
Kinh nghiệm làm việc với các công cụ ETL như Apache NiFi, Talend, hoặc Airflow là một lợi thế.
Kỹ năng phân tích và xử lý dữ liệu lớn:
Thành thạo với các công cụ quản lý dữ liệu như Kafka, Flink hoặc các nền tảng streaming khác là điểm cộng.
Có khả năng làm việc với dữ liệu lớn và hệ thống phân tán.
Kiến thức về kho dữ liệu và hệ thống lưu trữ dữ liệu: Kinh nghiệm xây dựng và tối ưu hóa kho dữ liệu (data warehouse) hoặc data lake, như AWS Redshift, Snowflake, BigQuery, hoặc Azure Synapse.
Có khả năng tư duy hệ thống và phân tích các vấn đề phức tạp trong quá trình xử lý dữ liệu.
Quyền lợi
Lương rất cao và hấp dẫn theo thoả thuận
Tối thiểu 13 tháng lương/năm.
Có nhiều cơ hội được đào tạo, làm việc nâng cao trình độ và cơ hội thăng tiến.
Văn phòng làm việc chuyên nghiệp hạng A.
Có nhiều hoạt động bổ trợ tinh thần, du lịch...
Xét tăng lương 1- 2 lần/năm.
Môi trường làm việc thân thiện và có tính tương hỗ cao, ổn định lâu dài.
Có cơ hội làm việc tại nước ngoài.
Thưởng: Thưởng Tết, thưởng ngày lễ, thưởng giới thiệu nhân sự...
Chế độ phúc lợi toàn diện.
Cập nhật gần nhất lúc: 2024-11-18 21:50:03
Công ty Yes4All LLC - Yes4All.com có trụ sở tại Nam California.Yes4All đang là một trong những nhà thiết kế, nhà sản xuất và phân phối thiết bị thể dục chất lượng cao, sáng tạo. Chúng tôi tin tưởng mạnh mẽ rằng mọi người chỉ có thể cống hiến và tạo ra những thay đổi tích cực khi họ có nghị lực và sức khỏe tốt. Tăng cường sức khỏe của một người không phải là một điều xa xỉ - mọi người đều có thể tận hưởng, do đó chúng tôi cam kết cung cấp cho khách hàng những sản phẩm tốt nhất hiện có với mức giá phải chăng.
Review Yes4All
Môi trường và văn hoá công ty siêu tệ
Đồng nghiệp trẻ nên thân thiện, dễ gần. Lương cũng ok hơn nhiều công ty (RW)
CEO chỉ biết ăn xổi thôi chứ không có chịu đầu tư dài hạn nào cả. Nền tảng kiến thức và kĩ năng chuyên môn ở đây không có, rất kém chuyên nghiệp. (RW)