Synthetic Data Engineer (AI Data/Training)

Hyphen Connect

Synthetic Data Engineer (AI Data/Training)

Hyphen Connect
Hong Kong
Thương lượngĐăng 36 phút trước

Thông tin thêm

Loại hình

full time

Kinh nghiệm

mid

Phòng ban

Engineering

6 việc tương tự đang tuyển

Mô tả công việc

We are seeking a talented and innovative Synthetic Data Engineer. In this role, you will design and implement domain-specific synthetic data generation pipelines, ensuring high-quality data management for training loops. Your expertise will drive the success of data processing and model training within the organization.

 

Responsibilities:

  • Design domain-specific synthetic data generation (SDG) pipelines via self-instruct and constitutional prompting.
  • Implement automated quality scoring and de-duplication systems.
  • Manage data pipelines that feed directly into SFT and DPO training loops.

Qualifications:

  • Proven experience building large-scale data pipelines (Airflow, Spark, Ray).
  • Deep knowledge of prompt engineering for data generation.
  • Familiarity with dataset distillation and bias mitigation.

Kỹ năng cần có

SparkAirflow

Kỹ năng phù hợp

Đăng ký để xem kỹ năng phù hợp

Hyphen Connect

Hyphen Connect

Engineering

Xem công ty →

Chúng tôi sử dụng cookie để cải thiện trải nghiệm, phân tích lưu lượng truy cập và hiển thị quảng cáo phù hợp. Bấm "Chấp nhận" để đồng ý sử dụng cookie.