Job Description
QuantCube is looking for a talented MLOps Engineer with a specialization in NLP. This role is ideal for individuals passionate about building and maintaining complex data and ML pipelines, with a keen interest in applying AI to real-world economic and financial challenges.
MISSIONS
The assignments you will be working on include:
Understand existing Data and ML pipelines and maintain existing Text Datalake
Design conceptual diagrams for data pipelines and ML workflows
Collaborate with Data Scientists to create robust modeling to approach the economic measure of interest using state of the art NLP models including LLMs, advanced Statistical Learning techniques, Time Series Analysis, Machine Learning technologies and AI
Develop end-to-end modeling pipelines in Python, applying software development approaches, from data ingestion to deployment.
Understand economic indicators, their methodologies, and influencing factors
Develop procedures for collecting and processing Big Data, using massive data engineering skills
Explore and assess the quality of available data sources
Develop and run quality tests on production indices
Collaborate with IT team including Data Architects and Data Engineers for pipeline implementation
QuantCube recherche un(e) ingénieur(e) MLOps talentueux(se) spécialisé(e) en NLP (traitement du langage naturel).
Ce poste est idéal pour les personnes passionnées par la construction et la maintenance de pipelines complexes de données et de modèles d’apprentissage automatique, avec un fort intérêt pour l’application de l’IA à des problématiques économiques et financières concrètes.
MISSIONS
Vous serez amené(e) à :
Comprendre les pipelines de données et de machine learning existants, et maintenir le datalake textuel actuel.
Concevoir des schémas conceptuels pour les pipelines de données et les workflows ML.
Collaborer avec les data scientists pour créer des modèles robustes afin d’approcher les indicateurs économiques d’intérêt, en utilisant des modèles NLP de pointe, y compris les LLMs (Large Language Models), des techniques avancées d’apprentissage statistique, l’analyse de séries temporelles, le machine learning et l’IA.
Développer des pipelines de modélisation de bout en bout en Python, en appliquant les bonnes pratiques du développement logiciel, de l’ingestion des données jusqu’au déploiement.
Comprendre les indicateurs économiques, leurs méthodologies et les facteurs qui les influencent.
Développer des procédures de collecte et de traitement des données massives, en mobilisant des compétences avancées en data engineering.
Explorer et évaluer la qualité des sources de données disponibles.
Développer et exécuter des tests de qualité sur des indices de production.
Collaborer avec l’équipe IT, notamment les architectes data et data engineers, pour la mise en œuvre des pipelines.