Mokhtar Boumedyen BILLAMI

Docteur en sciences du langage
Doctorat obtenu à l'Université d'Aix-Marseille
Laboratoire d'Informatique et systèmes (LIS)
LIS-CNRS UMR 7020
Pôle de recherche : Science des données
Équipe : Traitement Automatique du Langage Écrit et Parlé [TALEP]
École doctorale : Cognition, Langage, Éducation (ED-CLE)
E-Mail : mokhtar.billami@lis-lab.fr ; mokhtar.billami@univ-amu.fr

Publications

2018

HMIDA, F., BILLAMI, M. B., FRANÇOIS, T. et GALA, N. (2018). Assisted Lexical Simplification for French Native Children with Reading Difficulties. Proceedings of the Workshop Automatic Text Adaptation, 11th International Conference on Natural Language Generation. (ATA2018), Tilbourg, Pays-Bas. [article]

BILLAMI, M. B., FRANÇOIS, T. et GALA, N. (2018). RESYF: a French lexicon with ranked synonyms. Proceedings of the 27th International Conference on Computational Linguistics. (COLING2018), Santa Fe, Nouveau-Mexique, USA. [article] [site]

2017

Billami, M. B. et Gala, N. (2017). Création et validation de signatures sémantiques : application à la mesure de similarité sémantique et à la substitution lexicale. Actes de la 24e conférence Traitement Automatique des Langues Naturelles (TALN2017), Orléans, France. [article] [slides] [data]

2016

François, T., Billami, M. B., Gala, N. et Bernhard, D. (2016). Bleu, contusion, ecchymose : tri automatique de synonymes en fonction de leur difficulté de lecture et compréhension. Actes de la 23e conférence Traitement Automatique des Langues Naturelles (TALN2016) . Paris, France. [article]

Billami, M. B. et Gala, N. (2016). Approches d'analyse distributionnelle pour améliorer la désambiguïsation sémantique. Journées internationales d'Analyse statistique des Données Textuelles (JADT2016). Nice, France. [article] [slides]

2015

Gala, N. , Billami, M. B., François, T. et Bernhard, D. (2015). Graded lexicons: new resources for educational purposes and much more. In 22nd Computer-assisted language learning conference (EUROCALL2015 ). Padova, Italie. [article]

Billami, M. B. (2015). Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques. Actes de la 22e conférence Traitement Automatique des Langues Naturelles, session RÉCITAL (TALN-RÉCITAL2015). Caen, France. Prix du meilleur article RÉCITAL [article] [slides] [VidéoConférence]

2014

Billami, M. B., Camacho-Collados, J., Jacquey, E. et Kister, L. (2014). Annotation sémantique et validation terminologique en texte intégral en SHS. Actes de la 21e conférence Traitement Automatique des Langues Naturelles (TALN2014). Marseille, France. [article]

Camacho-Collados, J., Billami, M. B., Jacquey, E. et Kister, L. (2014). Approche statistique pour le filtrage terminologique des occurrences de candidats termes en texte intégral. Journées internationales d'Analyse statistique des Données Textuelles (JADT2014). Paris, France. [article]

Recherche scientifique

Projet de thèse et Co-encadrement de projets scientifiques

Projet de thèse

  •        Titre : Désambiguïsation sémantique dans le cadre de la simplification lexicale : contributions à un système d'aide à la lecture pour des enfants dyslexiques et faibles lecteurs.
  •        Directrice de thèse : Núria Gala
  •        Co-directeur de thèse : Johannes Ziegler

Résumé

La lecture est fondamentale pour tout ce qu'un enfant doit apprendre pendant son parcours scolaire. D'après des rapports nationaux (MJENR 2003) ou internationaux (PISA 2009), 20% à 30% des élèves français sont de faibles lecteurs et ont des difficultés pour comprendre les textes écrits, 5% à 10% sont des enfants dyslexiques. Ces lecteurs sont en grande difficulté face à des textes complexes ou avec un vocabulaire peu courant.

Ces dernières années, un nombre important de technologies ont été créées pour venir en aide aux personnes ayant des difficultés pour lire des textes écrits. Les systèmes proposés intègrent des technologies de la parole (lecture à « voix haute ») ou des aides visuelles (paramétrage et/ou mise en couleur des polices ou augmentation de l'espace entre lettres et lignes). Cependant, il est essentiel de proposer aussi des transformations sur le contenu afin d'avoir des substituts de mots plus simples et plus fréquents. Cela permettra de rendre les textes plus accessibles et plus faciles à lire et à comprendre. Le but de cette thèse est de contribuer à un système d'aide à la lecture permettant de proposer automatiquement une version simplifiée d'un texte donné tout en gardant le même sens des mots.

Le travail présenté adresse le problème de l'ambiguïté sémantique (très courant en traitement automatique des langues) et vise à proposer des solutions pour la désambiguïsation sémantique à l'aide de méthodes non supervisées et à base de connaissances provenant de ressources lexico-sémantiques. Dans un premier temps, nous proposons un état de l'art sur les méthodes de désambiguïsation sémantique et les mesures de similarité sémantique (essentielles pour la désambiguïsation sémantique). Par la suite, nous comparons divers algorithmes de désambiguïsation sémantique afin d'identifier le meilleur. Enfin, nous présentons nos contributions pour la création d'une ressource lexicale pour le français proposant des synonymes désambiguïsés et gradués en fonction de leur niveau de difficulté de lecture et compréhension. Nous montrons que cette ressource est utile et peut être intégrée dans un module de simplification lexicale de textes.

  •        Mots clés : Désambiguïsation Sémantique; Simplification Lexicale; Traitement Automatique des Langues (TAL); Enfants Dyslexiques; Faibles Lecteurs.

Co-encadrement avec Núria Gala

+ Stage développement ‒ Licence en informatique (Marseille, 2017‒2018)

  •        ‒ Titre : Plateforme d’accès à des corpus pour l’aide à la lecture dans le cadre du projet ANR ALECTOR (Aide à la LECTure pour améliORer l'accès aux documents pour les enfants dyslexiques).

+ Stage recherche ‒ Master 2 en informatique (Marseille, 2015‒2016)

  •        ‒ Titre : Plateforme d’entraînement à la lecture intégrant des mesures de la lisibilité et des aides à la simplification lexicale de la langue française.
  •        ‒ Propositions : Consultation d’une plateforme proposant des corpus parallèles (textes en version originale et leur simplification manuelle).
  •        ‒ Technologies utilisées : PHP, JavaScript et Python.

+ Travail d’Étude et de Recherche [TER] ‒ Master 1 en informatique (Marseille, 2014‒2015)

  •        ‒ Titre : Création d'un environnement en ligne permettant la consultation multi-critères d'un dictionnaire.
  •        ‒ Technologies utilisées : J2EE avec les frameworks Spring et Hibernate ; Utilisation d’une base de données avec MySQL Workbench.

Enseignements

Années d'enseignements
[2018 ‒ 2019] [2017 ‒ 2018] [2016 ‒ 2017] [2015 ‒ 2016]

2018 ‒ 2019

Attaché Temporaire d'Enseignement et de Recherche (ATER à temps plein)
+ Visual Basic pour la programmation d’applications (classe Préparatoire Intégrée (PeiP) de Polytech, première année, semestre 1) : service de 20 heures de COURS et 60 heures de Travaux Pratiques (TP)
+ Développement web (HTML, CSS, JavaScript) (PeiP, deuxième année, semestre 1) : service de 20 heures de Travaux Dirigés (TD)
+ Programmation structurée et langage C (École d'ingénieur Génie Industriel et Informatique (GII), troisième année, semestre 1) : service de 20 heures de TD et 60 heures de TP
+ Programmation objet et JAVA (GII, troisième année, semestre 2) : service de 40 heures de TP
+ Bases de données avancées (GII, cinquième et dernière année, semestre 1) : service de 16 heures de TP

2017 ‒ 2018

Attaché Temporaire d'Enseignement et de Recherche (demi-ATER)
+ Introduction à l'informatique et à la programmation (licence 1, semestre 1, crédits 6) : service de 26 heures de TP
       ‒ Algorithmique de base, en langage C, aux étudiants de première année
+ Automates et circuits (licence 1, semestre 2, crédits 6) : service de 30 heures de TD, 10 heures de TP et 4 heures d'Aide à la RÉussite (ARE)
       ‒ Bases du calcul informatique (codage, logique, circuit, relation et automate)
+ Langage XML (master 1, semestre 2, crédits 3) : service de 10 heures de TP
       ‒ XML, DTD et XSD
       ‒ XPath, XSLT et XQuery
+ Informatique 1 (licence 1, semestre 2, crédits 3) : service de 27 heures de TP
       ‒ Outils de conceptions d'algorithmes, rédaction d'algorithmes et programmation en langage C
+ Informatique 3 (licence 2, semestre 2, crédits 2) : service de 18 heures de TP
       ‒ Approfondissements des notions d'algorithme et de programmation ; Initiation à UNIX

2016 ‒ 2017

Enseignant moniteur
‒ Introduction à l'informatique et à la programmation : service de 40 heures de TP
+ Outils informatiques et Certificat Informatique et Internet (C2i) (licence 1, semestre 1, crédits 3) : service de 24 heures de TD
        ‒ Tableur ; HTML et CSS ; Traitement de texte (avec une initiation à LaTeX) ; Initiation aux commandes UNIX, redirections et scripts Bash

2015 ‒ 2016

Enseignant moniteur
+ Projet algorithmique (licence 2, semestre 4, crédits 6) : service de 12 heures de TP
        ‒ Packing 2D : remplir au mieux une boite de dimensions L x H avec n objets rectangulaires de largeurs l1, ..., ln et de hauteurs h1, ..., hn. Une contrainte de non chevauchement de ces objets dans la boite est à prendre en compte
‒ Introduction à l'informatique et à la programmation : service de 20 heures de TP
‒ Outils informatiques et C2i : service de 6 heures de cours et de 24h de TD

Contact

Mail

mokhtar.billami@lis-lab.fr
mokhtar.billami@univ-amu.fr

Adresse

Laboratoire d'Informatique et des Systèmes (LIS)
Parc Scientifique et Technologique de Luminy
163, avenue de Luminy - Case 901
F-13288 Marseille - Cedex 9 (France)