Remote
Job description
Rejoignez tether, une start‑up innovante basée à Singapour, qui développe les prochains modèles d’intelligence artificielle capables de comprendre et de générer du texte, des images, du son et de la vidéo. En tant qu’Ingénieur(e) Recherche IA spécialisé(e) dans le pré‑entraînement, vous intégrerez l’équipe « Modèles d’IA » et participerez à la conception, à l’optimisation et à la mise en production de modèles de grande taille (LLM) et de systèmes multimodaux. Vous travaillerez sur des infrastructures distribuées massives, composées de milliers de GPU NVIDIA, afin de repousser les limites de la performance et de l’efficacité énergétique.
**Missions principales**
- Concevoir et implémenter de nouvelles architectures de modèles (transformers, diffusion, multimodal) adaptées aux exigences de pré‑entraînement à grande échelle.
- Optimiser le pipeline de pré‑entraînement : gestion de données massives, stratégies de sharding, parallélisme de données et de modèles, réduction du temps de convergence.
- Développer et tester des algorithmes d’amélioration des baselines (sparsité, quantisation, mix‑precision, techniques de curriculum learning).
- Identifier, analyser et résoudre les goulets d’étranglement (IO, communication inter‑GPU, saturation de la mémoire) grâce à des outils de profiling avancés (Nsight, TensorBoard, Py‑Prof).
- Collaborer avec les équipes Data Engineering pour la curation, le nettoyage et le filtrage de jeux de données multi‑modaux (texte, image, audio).
- Publier des rapports de recherche internes, contribuer à des articles scientifiques et présenter les résultats lors de conférences ou de meet‑ups internes.
- Assurer la robustesse et la reproductibilité du code via des pratiques de MLOps : CI/CD, tests unitaires, containers Docker, orchestration Kubernetes.
**Profil recherché**
- Diplôme d’ingénieur, de master ou de doctorat en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle en recherche appliquée sur les grands modèles de langage ou les systèmes multimodaux.
- Maîtrise des frameworks Deep Learning (PyTorch, TensorFlow) et des bibliothèques de parallélisme (DeepSpeed, Megatron‑LM, FairScale).
- Solide expérience en programmation Python et C/C++, ainsi qu’en optimisation CUDA et utilisation de GPU NVIDIA.
- Connaissance approfondie des architectures LLM, des techniques de pré‑entraînement (masked language modeling, contrastive learning) et des stratégies de scaling law.
- Expérience avérée sur des clusters distribués (Kubernetes, Slurm) et sur la gestion de workloads à grande échelle.
- Capacité à travailler de façon autonome en remote, à communiquer clairement en anglais (écrit et oral) et à collaborer avec des équipes internationales.
**Ce que nous offrons**
- Un poste 100 % remote avec une flexibilité horaire adaptée aux fuseaux horaires mondiaux.
- Un environnement de travail stimulant, entouré d’experts de renommée mondiale en IA.
- Accès à une infrastructure de pointe (clusters GPU NVIDIA A100/A6000, stockage haute‑performance).
- Un package de rémunération compétitif, incluant des stock‑options et des bonus basés sur les performances.
- Des opportunités de formation continue, de participation à des conférences et de publication scientifique.
- Une culture d’entreprise axée sur l’innovation, la transparence et le bien‑être des collaborateurs.
Si vous êtes passionné(e) par la recherche appliquée, que vous aimez relever des défis techniques de grande envergure et que vous souhaitez contribuer à façonner l’avenir de l’IA, rejoignez tether dès aujourd’hui !