Photo de profil de Perrine Quennehen
🌍 FR • EN • 中文

Perrine Quennehen

Ingénieure en IA, Machine Learning & Data Science NLP

Disponible pour un CDI - Jan. 2026

Mes Projets

Découvrez mes projets en NLP, Machine Learning et développement. De la recherche académique aux applications professionnelles.

Professionnel2025

Plateforme de Domain Adaptation Multi-Mode pour Modèles Transformers - Domaine BTP

XLM-RoBERTa, Contrastive Learning, TSDAE, MLflow, Databricks

+

Plateforme de continued pretraining pour adapter XLM-RoBERTa au domaine BTP. Support multilingue (FR/EN) avec génération d'embeddings denses pour recherche sémantique downstream.

Techniques : 4 modes (MLM, Contrastive SimCSE+Triplet, TSDAE, Unified) • Hard negative mining cross-lingue FR-EN • Échantillonnage équilibré 50+ catégories
Optimisations : Layer freezing, gradient checkpointing, HPO Optuna (50+ trials) • -60% temps entraînement
Infrastructure : API REST (FastAPI) + MLflow + Databricks (10M+ docs)
Résultats : 70%+ triplets cross-lingues, OOM-safe GPU T4/V100

Technologies : XLM-RoBERTa, Contrastive Learning, PyTorch, Sentence-Transformers, Optuna, MLflow, Databricks, FastAPI, Domain Adaptation, Python

Professionnel2025

Analyse des Sentiments - Bouygues Construction

Transformers, CamemBERT, Python, NLP

+

Développement d'un système d'analyse des sentiments pour traiter automatiquement les retours clients et documents internes dans le secteur de la construction.

Fine-tuning de CamemBERT pour l'analyse de sentiment en français. Traitement de données textuelles du domaine de la construction. Classification multi-classes avec métriques de performance détaillées. Intégration dans un pipeline de production.

Technologies : Analyse des sentiments, CamemBERT, Transformers, Classification, NLP, Python, Fine-tuning, Production

Académique2025

Model T9 to Sinogram

Python, NLP, Machine Learning

+

Système T9 prédictif pour la saisie de caractères chinois, inspiré du clavier Sogou.

Développement d'un système prédictif T9 pour le chinois. À partir d'un corpus de textes, génération des séquences pinyin et T9 correspondantes pour entraîner un modèle de prédiction de caractères chinois via saisie numérique.

Technologies : Python, NLP, Machine Learning, Chinese NLP

Voir sur GitHub

Personnel2025

ChatBot FastAPI

Python, FastAPI, NLP

+

API de chatbot conversationnel développée avec FastAPI pour interactions en temps réel.

Backend de chatbot avec FastAPI permettant des conversations en langage naturel. Intégration de techniques NLP pour la compréhension contextuelle et la génération de réponses.

Technologies : Python, FastAPI, NLP, API Development

Voir sur GitHub

Académique2024

Chinese OCR

Python, Computer Vision, Deep Learning

+

Système OCR pour la reconnaissance de caractères chinois dans des documents.

Implémentation d'un système de reconnaissance optique de caractères spécialisé pour le chinois. Utilisation de techniques de deep learning pour la détection et reconnaissance de sinogrammes.

Technologies : Python, Computer Vision, Deep Learning, Chinese NLP

Voir sur GitHub

Académique2025

MTdV Translator

Python, Machine Translation, NLP

+

Traducteur automatique développé dans le cadre du cours de Traduction Automatique et Assistée.

Système de traduction automatique implémentant des modèles de traduction neuronale. Projet universitaire explorant différentes approches de machine translation.

Technologies : Python, Machine Translation, NLP

Voir sur GitHub

Personnel2025

Chinese-French Dictionary

C#, .NET

+

Application dictionnaire bilingue chinois-français avec interface de recherche avancée.

Dictionnaire bidirectionnel chinois-français développé en C#. Fonctionnalités de recherche avec support du pinyin et affichage des définitions, exemples et usages.

Technologies : C#, .NET, Desktop App

Voir sur GitHub

Académique2024

Voice Synthesizer

Python, Speech Processing

+

Synthétiseur vocal basé sur le traitement du signal et la phonétique. Projet M1 TAL.

Projet de synthèse vocale développé pour le cours de Phonétique. Génération de parole artificielle à partir de texte avec manipulation de paramètres prosodiques.

Technologies : Python, Speech Processing, Signal Processing

Voir sur GitHub

Académique2024

OpenNMT Translation

Python, OpenNMT, Neural Machine Translation

+

Traduction automatique neuronale avec OpenNMT. Projet du cours de Traduction Automatique.

Mise en œuvre de modèles de traduction neuronale avec le framework OpenNMT. Entraînement et évaluation de systèmes de traduction automatique.

Technologies : Python, OpenNMT, Neural Machine Translation

Voir sur GitHub