Mô tả công việc
Thiết kế và Xây dựng Hệ Thống Dữ Liệu:
Tạo lập hệ thống ETL (Extract, Transform, Load) để xử lý, làm sạch và chuyển đổi dữ liệu vào kho dữ liệu (data warehouse) hoặc các hệ thống lưu trữ dữ liệu khác.
Thiết kế, triển khai và duy trì các kiến trúc dữ liệu mạnh mẽ để thu thập, lưu trữ, và xử lý dữ liệu lớn từ nhiều nguồn khác nhau.
Xây dựng và Tối ưu Hóa Pipeline Dữ Liệu:
Xây dựng các pipeline dữ liệu tự động, linh hoạt để đảm bảo dữ liệu được cập nhật và có sẵn cho các phân tích theo thời gian thực hoặc batch.
Tối ưu hóa hiệu suất pipeline để đảm bảo xử lý dữ liệu nhanh chóng, hiệu quả và đáng tin cậy.
Quản lý Kho Dữ Liệu và Data Lake:
Thiết lập và quản lý kho dữ liệu (data warehouse) hoặc data lake, đảm bảo khả năng mở rộng và bảo mật dữ liệu.
Thực hiện các thao tác backup, phục hồi dữ liệu và tối ưu hóa việc truy xuất dữ liệu.
Đảm bảo Chất Lượng Dữ Liệu và Tính Toàn Vẹn:
Đảm bảo dữ liệu đáp ứng các tiêu chuẩn về chất lượng, tính toàn vẹn và độ chính xác.
Triển khai các công cụ và quy trình kiểm tra chất lượng dữ liệu để phát hiện và khắc phục các lỗi dữ liệu.
Phối Hợp và Hỗ Trợ Các Bộ Phận Khác:
Hỗ trợ các nhà khoa học dữ liệu và các phòng ban khác trong việc truy cập, xử lý và sử dụng dữ liệu.
Làm việc chặt chẽ với các bộ phận phát triển sản phẩm để đảm bảo hệ thống dữ liệu đáp ứng nhu cầu kinh doanh.
Yêu cầu công việc
Kinh nghiệm:
Tối thiểu 5 năm kinh nghiệm trong lĩnh vực Data Engineering, Khoa học Dữ liệu, hoặc các lĩnh vực liên quan.
Có kinh nghiệm với các hệ thống cơ sở dữ liệu lớn như SQL, NoSQL (MongoDB, Cassandra), và các hệ thống phân tán như Hadoop, Spark.
Kỹ năng lập trình:
Thành thạo Python, Java, Scala hoặc các ngôn ngữ lập trình liên quan đến xử lý dữ liệu.
Kinh nghiệm làm việc với các công cụ ETL như Apache NiFi, Talend, hoặc Airflow là một lợi thế.
Kỹ năng phân tích và xử lý dữ liệu lớn:
Thành thạo với các công cụ quản lý dữ liệu như Kafka, Flink hoặc các nền tảng streaming khác là điểm cộng.
Có khả năng làm việc với dữ liệu lớn và hệ thống phân tán.
Kiến thức về kho dữ liệu và hệ thống lưu trữ dữ liệu: Kinh nghiệm xây dựng và tối ưu hóa kho dữ liệu (data warehouse) hoặc data lake, như AWS Redshift, Snowflake, BigQuery, hoặc Azure Synapse.
Có khả năng tư duy hệ thống và phân tích các vấn đề phức tạp trong quá trình xử lý dữ liệu.
Quyền lợi
Lương rất cao và hấp dẫn theo thoả thuận
Tối thiểu 13 tháng lương/năm.
Có nhiều cơ hội được đào tạo, làm việc nâng cao trình độ và cơ hội thăng tiến.
Văn phòng làm việc chuyên nghiệp hạng A.
Có nhiều hoạt động bổ trợ tinh thần, du lịch...
Xét tăng lương 1- 2 lần/năm.
Môi trường làm việc thân thiện và có tính tương hỗ cao, ổn định lâu dài.
Có cơ hội làm việc tại nước ngoài.
Thưởng: Thưởng Tết, thưởng ngày lễ, thưởng giới thiệu nhân sự...
Chế độ phúc lợi toàn diện.
Cập nhật gần nhất lúc: 2024-11-18 21:50:03
Vbee là công ty hoạt động trong lĩnh vực sản xuất và cung cấp các sản phẩm, giải pháp về Công nghệ thông tin, đặc biệt liên quan đến các bài toán về số hoá, xử lý dữ liệu.
Vbee sở hữu một hệ sinh thái nền tảng và dịch vụ ứng dụng trí tuệ nhân tạo đầu tiên tại Việt Nam. Chúng tôi mang tới những sản phẩm và dịch vụ chuyển đổi số trong các lĩnh vực như: chuyển văn bản thành giọng nói, chuyển giọng nói thành văn bản, robot call, tổng đài nhân tạo, xây dựng clip tự động, trợ lý ảo thông minh và rất nhiều các dịch vụ khác.
Cùng với đội ngũ nhân sự trẻ, năng động và sáng tạo cũng như đội ngũ chuyên gia giàu kinh nghiệm đến từ trường đại học hàng đầu Việt Nam, chúng tôi không ngừng nghiên cứu và phát triển, hướng tới mục triêu trở thành công ty cung cấp giải pháp, dịch vụ số hoá và xử lý dữ liệu tiếng Việt tiên phong tại Việt Nam. Vbee., JSC tin tưởng sẽ đem đến cho khách hàng các sản phẩm và giải pháp có độ tin cậy cao, có chất lượng vượt trội.