Multimodal AI Systems Architect (AI Engineering)

Hyphen Connect

Multimodal AI Systems Architect (AI Engineering)

Hyphen Connect
Oregon
Thương lượngĐăng 35 phút trước

Thông tin thêm

Loại hình

full time

Kinh nghiệm

lead

Phòng ban

Engineering

6 việc tương tự đang tuyển

Mô tả công việc

We are seeking a talented Multimodal AI Systems Architect to develop and optimize AI systems that seamlessly integrate vision and audio models. This role focuses on enhancing our voice-to-voice interactions and multimodal retrieval capabilities, ensuring our systems are efficient and innovative.

 

Responsibilities:

  • Integrate vision encoders and audio-native models into core agent reasoning loops.
  • Optimize streaming latency for voice-to-voice AI interactions.
  • Architect multimodal RAG systems capable of retrieving insights from videos and PDFs.

Qualifications:

  • Experience with Whisper, CLIP, and multimodal LLM integration.
  • Knowledge of streaming architectures and WebRTC.
  • Expertise in cross-modal alignment.

 

Hyphen Connect

Hyphen Connect

Engineering

Xem công ty →

Chúng tôi sử dụng cookie để cải thiện trải nghiệm, phân tích lưu lượng truy cập và hiển thị quảng cáo phù hợp. Bấm "Chấp nhận" để đồng ý sử dụng cookie.