Mô tả công việc
Your role & responsibilities
- Thiết kế và xây dựng hệ thống xử lý dữ liệu: Chịu trách nhiệm thiết kế, xây dựng, và duy trì các hệ thống xử lý dữ liệu quy mô lớn, đảm bảo dữ liệu được xử lý và lưu trữ một cách hiệu quả, chính xác và an toàn.
- Phát triển và duy trì các pipeline dữ liệu: Làm việc chặt chẽ với các team khác để phát triển và duy trì các pipeline dữ liệu, đảm bảo dữ liệu được thu thập, chuyển đổi, và lưu trữ chính xác từ các nguồn khác nhau.
- Tối ưu hóa hiệu suất hệ thống: Tham gia vào việc tối ưu hóa hiệu suất của các hệ thống cơ sở dữ liệu và xử lý dữ liệu, đảm bảo rằng hệ thống hoạt động với hiệu suất cao nhất và đảm bảo khả năng mở rộng khi lưu lượng dữ liệu tăng.
- Trích xuất, tổng hợp dữ liệu phục vụ phân tích: Cung cấp hỗ trợ kỹ thuật cho các team phân tích dữ liệu và các bên liên quan khác, giúp họ tiếp cận và sử dụng dữ liệu một cách hiệu quả.
- Đảm bảo chất lượng dữ liệu: Thực hiện kiểm tra chất lượng dữ liệu để đảm bảo dữ liệu đầu vào và đầu ra đáp ứng các tiêu chuẩn chất lượng.
- Xử lý xung đột và lỗi tích hợp: Phát hiện, giải quyết và sửa chữa các xung đột và lỗi liên quan. Đảm bảo các luồng tích hợp đồng bộ/bất đồng bộ hoạt động một cách chính xác.
- Hỗ trợ triển khai và triển khai: Cung cấp hỗ trợ và hướng dẫn cho quá trình triển khai và triển khai hệ thống trong môi trường thực tế
- Vận hành và bảo trì: Vận hành, giám sát hiệu suất và bảo trì các luồng dữ liệu. Cảnh báo cho các bên liên quan khi hệ thống gặp sự cố. Khắc phục sự cố trong thời gian sớm nhất.
- Đảm bảo bảo mật dữ liệu và tuân thủ các quy định về quyền riêng tư trong quá trình xử lý dữ liệu.
- Hỗ trợ các dự án liên quan đến dữ liệu trong công ty theo điều động của quản lý.
Your skills & qualifications
- Yêu cầu tối thiểu: Thành thạo các công cụ Elasticsearch, Kakfa, PySpark, Airflow, Nifi và kinh nghiệm làm việc trong các dự án xử lý dữ liệu lớn và các hệ thống phân tán. Thành thạo phát triển ứng dụng trên Docker và triển khai vận hành trên Kubernetes.
- Kinh nghiệm về cơ sở dữ liệu: Thành thạo với các hệ quản trị cơ sở dữ liệu như SQL, NoSQL, và các công cụ như MySQL, PostgreSQL, Elasticsearch, Cassandra...
- Kiến thức về ETL (Extract, Transform, Load): Kinh nghiệm xây dựng và duy trì các pipeline ETL để thu thập, chuyển đổi, và tích hợp dữ liệu từ các nguồn khác nhau.
- Kinh nghiệm với các ngôn ngữ lập trình: Thành thạo ngôn ngữ Python trong xử lý các định dạng dữ liệu khác nhau và xử lý dữ liệu lớn.
- Hiểu biết về các công cụ Big Data: Kinh nghiệm làm việc với các công nghệ Big Data như Hadoop, Spark, Kafka...
- Kỹ năng xử lý dữ liệu: Kinh nghiệm làm việc với các công cụ xử lý dữ liệu bao gồm Pandas, NumPy và các công cụ tương tự.
- Kỹ năng giao tiếp và làm việc nhóm: Kỹ năng giao tiếp tốt, có khả năng làm việc hiệu quả trong môi trường nhóm.
- Hiểu biết sâu về xử lý dữ liệu lớn và phân tích dữ liệu.
- Thành thạo công cụ Data pipeline và workflow management: Airflow, Nifi.
- Kinh nghiệm làm việc với các giải pháp monitoring: Prometheus, Grafana, ELK Stack.
- Có kinh nghiệm làm việc với Kubernetes Orchestration và Configuration Management: Rancher, ArgoCD, Docker Compose, Docker. Có khả năng build docker image một cách tối ưu cho các pipeline.
- Có khả năng triển khai và vận hành Spark Job, Airflow Job, Cronjob trên môi trường Kubernetes.
Benefits for you
- Được hưởng lương phản ánh đúng năng lực và cạnh tranh trên thị trường
- Phụ cấp ngoài lương: Ăn sáng, ăn trưa tại Công ty
- Được đánh giá năng lực làm việc theo quý/năm và nâng cấp bậc trong công việc; làm việc, cộng tác cùng đội ngũ nhân sự chất lượng cao
- Được cung cấp trang thiết bị làm việc (Macbook, Laptop, LCD 24"...)
- Làm việc 5 ngày trên 1 tuần (nghỉ thứ 7 chủ nhật)
- Cơ hội tham gia các khóa đào tạo chuyên môn, nâng cao kỹ năng thực hiện công việc, kỹ năng mềm và thi các chứng chỉ CNTT
- Môi trường làm việc trẻ trung, năng động, được tạo điều kiện để phát huy tối đa năng lực, nhiều cơ hội thăng tiến
- Văn phòng làm việc hiện đại, không gian mở, tòa nhà không chung với các công ty khác
- Chế độ nghỉ phép và bảo hiểm (BHXH-BHYT-BHTN) theo quy định pháp luật
- Chế độ Bảo hiểm sức khỏe cho bản thân và người nhà
- Hỗ trợ chi phí đi công tác
- Tham gia các hoạt động văn hóa nội bộ, team building, nghỉ mát hàng năm
- Chế độ mừng kết hôn, quà nhân ngày Lễ/ Tết và các chế độ phúc lợi khác
Yêu cầu công việc
Quyền lợi được hưởng
- Được hưởng lương phản ánh đúng năng lực và cạnh tranh trên thị trường
- Phụ cấp ngoài lương: Ăn sáng, ăn trưa tại Công ty
- Được đánh giá năng lực làm việc theo quý/năm và nâng cấp bậc trong công việc; làm việc, cộng tác cùng đội ngũ nhân sự chất lượng cao
- Được cung cấp trang thiết bị làm việc (Macbook, Laptop, LCD 24"...)
- Làm việc 5 ngày trên 1 tuần (nghỉ thứ 7 chủ nhật)
- Cơ hội tham gia các khóa đào tạo chuyên môn, nâng cao kỹ năng thực hiện công việc, kỹ năng mềm và thi các chứng chỉ CNTT
- Môi trường làm việc trẻ trung, năng động, được tạo điều kiện để phát huy tối đa năng lực, nhiều cơ hội thăng tiến
- Văn phòng làm việc hiện đại, không gian mở, tòa nhà không chung với các công ty khác
- Chế độ nghỉ phép và bảo hiểm (BHXH-BHYT-BHTN) theo quy định pháp luật
- Chế độ Bảo hiểm sức khỏe cho bản thân và người nhà
- Hỗ trợ chi phí đi công tác
- Tham gia các hoạt động văn hóa nội bộ, team building, nghỉ mát hàng năm
- Chế độ mừng kết hôn, quà nhân ngày Lễ/ Tết và các chế độ phúc lợi khác
Công ty TNHH Giải pháp và Công Nghệ Apollo là công ty về Công nghệ với đội ngũ nhân sự trình độ cao, chuyên cung cấp các giải pháp tích hợp, phân tích dữ liệu, hỗ trợ các giải pháp chuyển đổi số.
Chính sách bảo hiểm
- Được hưởng các chế độ bảo hiểm : BHYT, BHXH, BHTN
- Hưởng quyền lợi bảo hiểm 24/7
Các hoạt động ngoại khóa
- Du lịch hàng năm
- Team building theo quý
- Các hoạt động vui chơi, giải trí, ca hát thường xuyên
- Thể thao: Đá bóng, bóng chuyền,..
Lịch sử thành lập
- Công ty được thành lập năm 2020
Mission
Các mục tiêu chúng tôi đặt ra cho chương trình bền vững phản ánh trực tiếp tầm nhìn của chúng tôi về việc đảm bảo một tương lai lành mạnh hơn cho ngành
Mọi người cũng đã tìm kiếm
Công việc của Data Engineer là gì?
Data Engineer hay kỹ sư chuyên về dữ liệu thường làm các công việc như phân tích nguồn dữ liệu, tích hợp thông tin giữa các hệ thống nhất với nhau, chuyển đổi và đồng bộ các dữ liệu trên nhiều hệ thống riêng biệt. Các nguồn dữ liệu ở đây được biết đến như các phần mềm website trong hoạt động các lĩnh vực bán hàng, nhân sự, tài chính, kế toán,....Bên cạnh đó, những vị trí như Data science, Data Analyst cũng thường đảm nhận các công việc tương tự.
Mô tả công việc của vị trí Data Engineer
Phân tích, tổng hợp, lưu trữ dữ liệu
Data Engineer kết hợp cùng DBA tạo ra các vùng lưu trữ dữ liệu từ các nguồn hệ thống thích hợp và mang lại hiệu quả cao. Nhiệm vụ của kỹ sư dữ liệu là đưa các dữ liệu vào Database và File Sever bằng cách (FTP, drag and drop…) và lưu trữ bằng (.csv, xlsx, .dat, database).
Chuẩn hóa và chuyển đổi logic, tập trung nguồn dữ liệu
Các dữ liệu được Data Engineer lưu chuyển đến các nguồn lữu trữ khác nhau nhằm mục đích so sánh, thêm dữ liệu và dự phòng các dữ liệu cho nhiều trường hợp khác nhau. Kỹ sư dữ liệu tập trung nguồn dữ liệu đưa các thông tin về một nguồn lưu trữ chung với các mô hình chuyên biệt, dành cho việc khôi phục phân tích các dữ liệu cần thiết trong các tình huống dự phòng.
Phân tích và trích xuất dữ liệu
Data Engineer sẽ kết hợp cùng với DBA (Database Administration) để tạo các vùng lưu trữ dữ liệu, đồng thời đảm bảo các yếu tố về bảo mật riêng tư, tính hiệu quả. Bên cạnh đó sẽ theo dõi và kiểm tra các nguồn dữ liệu được đưa từ các Database.
Triển khai machine learning cho hệ thống dữ liệu
Các mô hình học máy được thiết kế bởi các Data Engineers. Các Data Engineer chịu trách nhiệm triển khai chúng vào môi trường sản xuất. Điều này đòi hỏi phải cung cấp cho mô hình dữ liệu được lưu trữ trong kho hoặc đến trực tiếp từ các nguồn, định cấu hình thuộc tính dữ liệu, quản lý tài nguyên máy tính, thiết lập công cụ giám sát, v.v.
Data Engineer có mức lương bao nhiêu?
Lương cơ bản
Lương bổ sung
228 - 387 triệu
/nămLộ trình sự nghiệp Data Engineer
Tìm hiểu cách trở thành Data Engineer, bạn cần có những kỹ năng và trình độ học vấn nào để thành công cũng như đạt được mức lương mong đợi ở mỗi bước trên con đường sự nghiệp của bạn.
Số năm kinh nghiệm
Điều kiện và Lộ trình trở thành một Data Engineer?
Yêu cầu tuyển dụng của Data Engineer
Để thực hiện tốt các nhiệm vụ được giao, Data Engineer cần sở hữu những kiến thức, chuyên môn vững vàng và thành thạo những kỹ năng mềm liên quan:
Yêu cầu bằng cấp và kiến thức chuyên môn
-
Bằng cấp và chuyên ngành: Yêu cầu ứng viên đang theo học hoặc mới tốt nghiệp bằng Đại học chuyên ngành liên quan như Khoa học Dữ liệu, Khoa học Máy tính, Kỹ thuật Máy tính, Toán học, Thống kê, hoặc các ngành tương đương.
-
Kiến thức về bảo mật dữ liệu: Bảo mật dữ liệu là một yêu cầu quan trọng. Data Engineers cần hiểu về các biện pháp bảo mật và kiến thức về quyền truy cập dữ liệu.
-
Kỹ năng xử lý dữ liệu: Khả năng xử lý và biến đổi dữ liệu là quan trọng. Data Engineers cần hiểu về các công cụ và framework xử lý dữ liệu như Apache Spark, Apache Flink, hoặc Apache Kafka.
Yêu cầu về kỹ năng
-
Kỹ năng lập trình: Yêu cầu đối với Data Engineer là cần biết cơ bản về SQL, Python, Oracle. Kỹ sư dữ liệu không yêu cầu phải biết sâu về lập trình, tính toán nhưng phải nắm rõ các khái niệm và giá trị đằng sau các công thức hiển thị ở màn hình.
-
Kỹ năng phân tích logic: Kỹ năng phân tích logic luôn cần thiết trong các công việc cần sự chính xác và có tính liên kết với nhau. Data Engineer phải biết cách phân tích và tìm ra được ý nghĩa của những con số cũng như dữ liệu khô khan. Dựa vào đó, công ty có thể nhìn nhận được vấn đề để tìm ra hướng giải quyết phù hợp.
-
Kỹ năng thiết kế và trình bày báo cáo: Sau khi hoàn thành các công việc phân tích, bạn sẽ thu thập dữ liệu và lập bảng báo cáo trình bày lên cấp trên. Việc thiết kế và trình bày báo cáo phải mang tính dễ hiểu, dễ đưa ra các nhận định so sánh. Để giúp công việc trở nên thuận lợi hơn bạn có thể tự học hỏi và xem thêm các công cụ hỗ trợ thiết kế báo cáo.
Yêu cầu khác
-
Kinh nghiệm: Yêu cầu các Data Engineer đã có 1 - 2 năm kinh nghiệm. Hiểu rõ về các mô hình dữ liệu, thuật toán, kỹ thuật chuyển đổi dữ liệu. Có kinh nghiệm liên quan đến các giải pháp BI và ETL (trích xuất, chuyển đổi, tải dữ liệu) liên quan đến kho dữ liệu, các công cụ phân tích. Sử dụng được những công cụ chuyên dụng như Hadoop, Kafka,…
Lộ trình thăng tiến của Data Engineer
Lộ trình thăng tiến của Data Engineer có thể khá đa dạng và phụ thuộc vào tổ chức và ngành nghề cụ thể. Dưới đây là một lộ trình thăng tiến phổ biến cho vị trí này.
1. Intern Data Engineer
Mức lương: 2 - 4 triệu/ tháng
Kinh nghiệm làm việc: Dưới 1 năm
Intern Data Engineer là người được đào tạo, hướng dẫn đồng thời chịu trách nhiệm hỗ trợ các công việc thực tế của một Data Engineer thực thụ để bồi dưỡng thêm kinh nghiệm, nắm rõ được trách nhiệm ngành nghề của mình. Áp dụng nguyên tắc phần mềm, công nghệ vào phát triển, bảo trì, thiết kế, kiểm tra và đánh giá các phần mềm máy tính.
>> Đánh giá: Trong lĩnh vực khoa học dữ liệu, Intern Data Engineer là một trong những vị trí được đánh giá tương đối phức tạp và đòi hỏi nhiều kỹ năng. Theo đó, vai trò của Intern Data Engineer đó là thực hiện các phân tích, đánh giá dữ liệu quan trọng cho các hoạt động của doanh nghiệp. Là công việc thu hút rất nhiều ứng viên trẻ mới ra trường bởi mức lương hấp dẫn và lộ trình phát triển rộng mở.
>> Xem thêm: Việc làm Thực tập sinh Data Engineer cho người mới
2. Data Engineer
Mức lương: 18 - 30 triệu/ tháng
Kinh nghiệm làm việcb 1 - 4 năm
Data Engineer thường làm các công việc như phân tích nguồn dữ liệu, tích hợp thông tin giữa các hệ thống nhất với nhau, chuyển đổi và đồng bộ các dữ liệu trên nhiều hệ thống riêng biệt. Các nguồn dữ liệu ở đây được biết đến như các phần mềm website trong hoạt động các lĩnh vực bán hàng, nhân sự, tài chính, kế toán,....
>> Đánh giá: Doanh nghiệp hoạt động kinh doanh hiện nay không chỉ quan tấm đến vấn đề quản lý nguồn dữ liệu mà họ còn có mong muốn tìm ra hướng giải quyết mở rộng tài nguyên để lưu trữ và kiểm soát nguồn dữ liệu. Để làm được như vậy họ cần có Data Engineer - người sẽ giúp họ thực hiện các giải pháp trên. Chính vì thế đây là ngành nghề có xu hướng tuyển dụng tăng trong các năm tiếp theo.
>> Xem thêm: Việc làm Data Engineer đang tuyển dụng
5 bước giúp Data Engineer thăng tiến nhanh trong trong công việc
Trang bị các chứng chỉ liên quan
Bạn có thể ghi danh vào những khóa học dài hạn hoặc những chứng chỉ online để vừa củng cố chuyên môn, vừa được chứng nhận có kiến thức về một lĩnh vực. Các Data Engineer tiềm năng có thể tìm hiểu việc có được các chứng chỉ chuyên môn như AWS Certified Data Analytics, Microsoft Certified: Azure Data Engineer Associate, hoặc các khóa học online uy tín cũng sẽ giúp bạn khẳng định năng lực và tăng khả năng cạnh tranh trên thị trường lao động.
Phát triển kỹ năng thống kê
Đây cũng là kiến thức cơ bản bạn cần nắm. Bạn nên bắt đầu nghiêm túc với các môn học xác suất thống kê, thống kê mô tả để nắm được các khái niệm cơ bản như nghịch lý Simpson, phân tích dữ liệu khám phá (EDA), liên kết các biến,… Đó sẽ là tiền đề vững chắc để bạn phát triển hơn trong nghề.
Có khả năng thu thập, xử lý và phân tích dữ liệu
Dữ liệu ngày nay vô cùng đa dạng và đến từ nhiều nguồn khác nhau (như bảng khảo sát, thống kê mạng xã hội, điện thoại di động,...). Từ đống dữ liệu “lộn xộn” đó bạn phải xử lý về cùng một ngôn ngữ mà máy đọc được. Vì vậy bạn cần chú trọng đến các kỹ năng này để làm việc hiệu quả, năng suất, tiết kiệm thời gian hơn.
Đầu óc tư duy nhạy bén
Với một Data Engineer cần phải tư duy hơn người bình thường. Bạn là người làm việc với dữ liệu và sử dụng bộ não để nhìn nhận từ nhiều góc độ để tìm ra giải pháp hiệu quả nhất. Do đó, nếu bạn không có cái nhìn đa chiều thì rất khó để giải quyết được vấn đề.
Hiểu rõ thuật toán Machine Learning
Đây có thể cho là kỹ năng cần thiết nhất đối với một Data Engineer. Hiểu đơn giản, Machine Learning là “dạy” máy tính học các dữ liệu lịch sử, dữ liệu có sẵn để đưa ra được các quyết định tự trị một cách thông minh. Hiểu rõ cơ chế hoạt động này sẽ giúp Data Engineer tiết kiệm được nhiều thời gian trong việc khám phá, dự báo từ dữ liệu.
Đọc thêm: