Bui Marc

Informatique
Humanités numériques

, by Agnès

Professeur des Universités, Directeur d’Études Cumulant à l’EPHE

Contacter Mar Bui
BIBLIOGRAPHIE AOROC

Marc BUI est professeur des universités en informatique à l’Université Paris 8 et directeur d’études cumulant à l’Ecole Pratique des Hautes Etudes. Il est membre du laboratoire AOROC, UMR 8546, Archéologie et philologie d’Orient et d’Occident, au sein du pôle Humanités numériques.

 

THÈMES DE RECHERCHE

Au sein du pôle Humanités numériques du laboratoire AOROC, je m’intéresse aux techniques d’apprentissage automatique et leur application aux données historiques ou archéologiques. Je travaille actuellement sur des données numériques d’inscriptions anciennes du Vietnam. Dans le cadre du programme Vietnamica , Historical Research and Data Processing on Ancient Vietnamese Inscriptions dirigé par le professeur Philippe Papin , je contribue au développement de méthodes d’analyse informatique pour l’examen d’inscriptions sur stèles.
Mes autres centres d’intérêt sont la modélisation et la simulation de systèmes socio-techniques complexes, activités de simulation informatiques menées depuis de nombreuses années et qui font appel au calcul distribué.

 

TRAVAUX EN COURS

J’étudie actuellement le traitement numérique des inscriptions anciennes du Vietnam. Je contribue au développement de méthodes d’IA pour l’analyse informatique des documents-images que sont les estampages de stèle, à la transcription automatique et à la conservation numérique des documents textuels.
Le traitement des estampages des stèles numérisés implique d’imaginer le modèle conceptuel des données permettant de décrire les textes des inscriptions et leurs supports afin, d’une part, de les conserver en produisant la base de données afférente, de les relier à de l’information géographique et, d’autre part, de les rendre accessibles à des requêtes d’interrogation ou de consultation par le réseau internet.
Les traitements numériques tels que la segmentation sémantique des estampages de stèles ou la transcription automatique des écritures font appel aux techniques de l’apprentissage profond (IA, deep learning). Ces développements informatiques et analyses sont menés en collaboration avec des collègues chercheurs informaticiens ou philologues et historiens du Vietnam ancien . En s’appuyant sur des développements open-source, on vise à mettre en œuvre une détection automatique de la structure interne des stèles c’est à dire une détection flexible des colonnes de sinogrammes, assurer la distinction image/texte, identifier correctement l’alignement vertical des caractères pour la transcription en produisant des modèles d’apprentissage profond ré-utilisables. Des techniques spécifiques sont également mises en œuvre pour les tâches de transcription automatique ou de détection de sinogrammes particuliers.

 

PARCOURS

●  1991-1995 Maître de conférences, Université Paris 10
●  1995-1999 Professeur des universités, Université de Technologie de Compiègne.
●  1999-présent Professeur des universités, Université Paris 8.
●  2005-présent Directeur d’études cumulant à l’EPHE.