These Rita Hijazi

Rita Hijazi, « Simplification syntaxique de textes à base de représentation sémantique exprimées avec le formalisme Dependency Minimal Recursion Semantics (DMRS) ». Thèse AMU. Co-direction avec N. Gala. (LPL). Soutenance le 14 décembre  2022. Manuscrit

Cette recherche porte sur la proposition d’une méthode et d’un système informatique associé de simplification syntaxique de phrases. Cette simplification syntaxique repose dans cette thèse sur des transformations de représentation sémantique des phrases à simplifier, transformation réalisées par des règles définies manuellement. Nous avons retenue une représentation sémantique de texte spécifique, une représentation sémantique profonde, la notation DMRS (Dependency Minimal Recursion Semantics) attribuée par Copestake (2009), notation DMRS prennant en compte à la fois les annotations sémantiques et syntaxiques des phrases. La méthode de simplification syntaxique proposée repose sur trois étapes principales. La première étape consiste à représenter la phrase complexe par un graphe DMRS, dans le seconde étape il s’agit de transformer ce graphe DMRS en un ou plusieurs autres graphes DMRS en appliquant un ensemble de règles de transformation. Enfin, dans la troisième étape s’agit de générer à partir de ces nouveaux graphes obtenus les phrases simplifiées associées à la phrase complexe de départ. Les outils informatique utilisés sont notamment le parseurs DMRS (et générateur) ACE, le système de réécriture de graphe à base de règles GREW, les visualisateurs de graphes, tout en développant un algorithme pour automatiser la tâche. Nous traitons différentes constructions syntaxiques, telles que les coordinations, les relatives et les appositives.

This research concerns the proposal of a method and an associated computer system for the syntactic simplification of sentences. This syntactic simplification is based in this thesis on transformations of the semantic representation of the sentences to be simplified, transformations carried out by manually defined rules. We have chosen a specific semantic representation of text, a deep semantic representation, the DMRS notation (Dependency Minimal Recursion Semantics) attributed by Copestake (2009), a DMRS notation taking into account both semantic and syntactic annotations of sentences. The proposed syntactic simplification method is based on three main steps. The first step consists in representing the complex sentence by a DMRS graph, in the second step it consists in transforming this DMRS graph into one or several other DMRS graphs by applying a set of transformation rules. Finally, in the third step, the simplified sentences associated with the original complex sentence are generated from these new graphs. The computer tools used are the DMRS parser (and generator) ACE, the rule-based graph rewriting system GREW, graphs viewers, while developing an algorithm to automate the task. We deal with different syntactic constructions, such as coordinations, relatives and appositives.