Here you can find a list of my publications. Please feel free to check out their .pdf versions.
International journal papers
Ismail Badache, Adrian Chifu, Sébastien Fournier. Unsupervised and Supervised Methods to Estimate Temporal-Aware Contradictions in Online Course Reviews.
In: Mathematics Journal Vol.10, No.5 (Mathematics 2022).
Access:
Ismail Badache. 2SRM: Learning Social Signals for Predicting Relevant Search Results.
In: Web Intelligence Journal Vol.18, No.1 (WI IOS Press 2020).
Access:
National journal papers
Ismail Badache, Sébastien Fournier, Adrian Chifu. Prédire l'intensité de contradiction dans les commentaires : faible, forte ou très forte ?
In: Revue d'Intelligence Artificielle (RIA 2020).
Ismail Badache, Sébastien Fournier, Adrian Chifu. Prédire l'intensité de contradiction dans les commentaires : faible, forte ou très forte ?
In: Le Bulletin n°101 Association Française pour l'Intelligence Artificielle (AFIA 2019).
Access:
International conference papers
Ismail Badache. Exploring Differences in the Impact of Users' Traces on Arabic and English Facebook Search.
In: IEEE/WIC/ACM International Conference on Web Intelligence (WI 2019).
Access:
Ismail Badache. Users' Traces for Enhancing Arabic Facebook Search.
In: ACM Hypertext and Social Media (HT 2019).
Access:
Ismail Badache, Sébastien Fournier, Adrian Chifu. Predicting Contradiction Intensity: Low, Strong or Very Strong?.
In: ACM SIGIR Special Interest Group on Information Retrieval (SIGIR 2018).
Access:
Ismail Badache, Sébastien Fournier, Adrian Chifu. Contradiction in Reviews: is it Strong or Low?.
In: BroDyn Workshop at European Conference on Information Retrieval (BroDyn@ECIR 2018).
Access:
Ismail Badache, Sébastien Fournier, Adrian Chifu. Finding and Quantifying Temporal-Aware Contradiction in Reviews.
In: Asia Information Retrieval Societies (AIRS 2017).
Access:
Ismail Badache, Sébastien Fournier, Adrian Chifu. Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity in Temporal-Related Reviews.
In: Conference on Knowledge-Based and Intelligent Information and Engineering Systems (KES 2017).
Access:
Ismail Badache, Mohand Boughanem. Emotional Social Signals for Search Ranking
In: ACM SIGIR Special Interest Group on Information Retrieval (SIGIR 2017).
Access:
Ismail Badache, Mohand Boughanem. Fresh and Diverse Social Signals: Any Impacts on Search?
In: ACM Conference on Human Information Interaction and Retrieval (CHIIR 2017).
Access:
Mélanie Imhof, Ismail Badache, Mohand Boughanem. Multimodal Social Book Search.
In: Conference on Multilingual and Multimodal Information Access Evaluation (CLEF 2015).
Access:
Ismail Badache, Mohand Boughanem. A Priori Relevance Based On Quality and Diversity Of Social Signals.
In: ACM SIGIR Special Interest Group on Information Retrieval (SIGIR 2015).
Access:
Ismail Badache, Mohand Boughanem. Document Priors Based On Time-Sensitive Social Signals.
In: European Conference on Information Retrieval (ECIR 2015).
Access:
Ismail Badache, Mohand Boughanem. Social Priors to Estimate Relevance of a Resource.
In: ACM Information Interaction in context (IIiX 2014).
Access:
Ismail Badache, Mohand Boughanem. Harnessing Social Signals to Enhance a Search.
In: IEEE/WIC/ACM International Conference on Web Intelligence (WIC 2014).
Access:
National conference papers
NEW! Brice Le Roux, Maria Impedovo, Ismail Badache. Les robots en classe : : Exploitation de la robotique dans les apprentissages en sciences et technologie.
In: Journée Scientifique de SFERE-Provence (SFERE-Provence 2021).
Access:
Ismail Badache, Aya Abu-Thaher, Mariam Hamdan, Lara Abu-Jaish. Recherche d'Information Sociale en Langue Arabe : Cas de Facebook
In: COnférence en Recherche d'Information et Applications (CORIA 2019).
Access:
Ismail Badache, Sébastien Fournier, Adrian Chifu. Prédire l'intensité de contradiction dans les commentaires : faible, forte ou très forte ?
In: journées francophones d'Ingénierie des Connaissances (IC 2018) - 2nd Best Paper.
Access:
Ismail Badache, Sébastien Fournier, Adrian Chifu. Détection de contradiction dans les commentaires.
In: COnférence en Recherche d'Information et Applications (CORIA 2017).
Access:
Ismail Badache, Mohand Boughanem. Les Signaux Sociaux Émotionnels : Quel impact sur la recherche d'information ?.
In: COnférence en Recherche d'Information et Applications (CORIA 2017).
Access:
Ismail Badache, Mohand Boughanem. Pertinence a Priori Basée sur la Diversité et la Temporalité des Signaux Sociaux.
In: COnférence en Recherche d'Information et Applications (CORIA 2015).
Access:
Ismail Badache, Mohand Boughanem. Exploitation de signaux sociaux pour estimer la pertinence a priori d'une ressource.
In: COnférence en Recherche d'Information et Applications (CORIA-CIFED 2014).
Access:
Ismail Badache, Mohand Boughanem. RI sociale: intégration de propriétés sociales dans un modèle de recherche.
In: COnférence en Recherche d'Information et Applications (CORIA 2013).
Access:
Ismail Badache. Les contenus sociaux : Quel impact sur le processus de RI et la quantification de contradiction.
Seminary (Team DRIM, LIRIS - Lyon). Mars 2018.
Access:
Ismail Badache. Exploitation des contenus sociaux dans des tâches de RI et de détection de contradiction.
Seminary (Team TALEP, LIF - Marseille). April 2017.
Keywords: Information retrieval, Social Networks, User generated content, Social Signals, Social properties, Time, Diversity.
Abstract
Our work is in the context of social information retrieval (SIR) and focuses on the exploitation of user-generated content in the process of seeking information. The Usergenerated content, or UGC, refers to a set of data (eg. social signals) whose content is mainly produced either directly influenced by end users. It is opposed to the traditional content produced, sold or distributed by professionals. The term became popular since 2005, in the Web 2.0 environments and in new social media. This movement reflects the democratization of the means of production and interaction in the web thanks to new technologies. Among these means more and more accessible to a wide public, we can cite social networks, blogs, microblogs, wikis, etc.
The majority of information retrieval (IR) systems exploit two classes of features to rank documents in response to user's query. The first class, the most used one, is querydependent, which includes features corresponding to particular statistics of query terms such as term frequency, and term distribution within a document or in the collection of documents. The second class, referred to as documents prior, corresponds to queryindependent features such as the number of incoming links to a document, PageRank, topical locality, presence of URL, document authors, etc.
One of the important sources which can also be used to measure the a priori interest of Web resources is social data (signals) associated with Web resource resulting from user interaction with this resource. These interactions representing annotations, comments or votes, produce useful and interesting social information that characterizes a resource in terms of popularity and reputation. Major search engines integrate social signals (e.g. Google, Bing). Searchmetrics showed that it exists a high correlation between social signals and the rankings provided by search engines such Google. We propose an approach that exploits social signals generated by users on the resources to estimate a priori relevance of a resource. This a priori knowledge is combined with topical relevance modeled by a language modeling (LM) approach.
We also hypothesize that signals are time-dependent, the date when the user action has happened is important to distinguish between recent and old signals. Therefore, we assume that the recency of signals may indicate some recent interests to the resource, which may improve the a priori relevance of document. Secondly, number of signals of a resource depends on the resource age. Generally, an old resource may have much more signals than a recent one. We introduce the time-aware social approach that incorporates temporal characteristics of users' actions as prior in the retrieval model. Precisely, instead of assuming uniform document priors in this retrieval model, we assign document priors based on the signals associated to that document biased by both the creation date of the signals and the age of the document.
Access (FR Version)
Teachings
Here is some of my teaching courses (French).
My teaching activities of the current year are on my ePortfolio: click here (only for AMU members)
IA et éducation
Système intégré de gestion de bibliothèque
Techniques d'accès à l'information : les SRI
Veille scientifique et outils bibliographiques : Zotero 5.0
E-Portfolio : Votre vitrine numérique
Numérique éducatif et éducation aux médias
Systèmes d'information de gestion (PGI, ERP en anglais)
Systèmes de gestion de bases de données
Analyse et conception des systèmes d'information
Programmation Web (HTML,PHP, J2EE)
Recherche d'information et réseaux sociaux
Environnement numérique (Pix, C2i, MS-Office)
Accompagnement et initiation aux outils informatique
Tools
Here you can find a list of my some online softwares.
1) Arabic Sentiment Analysis (تحليل المشاعر الكتابية باللغة العربية).
This work has just been born ... the best will come.
2) Emotion Analysis (Happy, Sad, Angry, Excited, Sarcasm or Fear).
Please pass short texts (tweets, reviews, Posts, etc.)
3) Sentiment model based on Fast and accurate Naive Bayes classification.
This tool works by examining individual words and short sequences of words (n-grams) and comparing them with a probability model. The probability model is built on a set of pre-labeled tests of IMDb movie reviews. It can also detect negations in sentences, ie the phrase "not bad" will be classified as positive despite having two individual words with a negative feeling. Some adverbs like "very", "absolutely" are taken into account in sentiment estimation, as well as some implicitly negative phrases like "I regret ..." can be identified as sequences carrying a negative polarity.
4) Social data extractor from several social networks by using URL.
Projects
Here you can find a few details of my research projects.
NEW! Dream*U (Dessine ton PaRcours vers la REussite à Aix-Marseille Université)
Description: Favoriser la réussite de l'étudiant en développant son autonomie : telle est l'ambition portée par
Aix-Marseille Université (AMU) dans le projet DREAM-U. Cette ambition nécessite de prendre en compte
la forte diversité des étudiants accueillis aujourd'hui à l'université, un enjeu qui se pose avec
une acuité particulière pour AMU qui compte près de 26 000 étudiants inscrits en licence générale avec
des taux de réussite inférieurs à la moyenne nationale en L1.
Pour répondre à cet enjeu, le projet DREAM-U, lauréat du 2ème AAP NCU du PIA 3 et doté de 10,4 M€ sur
10 ans, repose sur un plan d'action qui se décline en quatre "chantiers " opérationnels : faire évoluer
l'architecture de l'offre en proposant des cursus modulaires et le développement d’enseignements
transversaux (chantier 1) ; renforcer l'accompagnement des étudiants dès leur entrée à l'université
grâce à un suivi individualisé et des dispositifs complémentaires de parrainage (chantier 2) ;
transformer les pratiques pédagogiques par le développement du numérique dans les enseignements et
l'accompagnement des enseignants dans la mise en oeuvre des pédagogies actives (chantier 3) ;
évaluer régulièrement l'impact du projet par le pilotage de la qualité et développer un programme
de recherche ancré sur le terrain (chantier 4 transversal)
Présentation du projet AMPIRIC (INSPE site d'Aix - 01/12/2020):
NEW! AMPIRIC (Aix-Marseille Pôle d'Innovation de Recherche d'enseIgnement pour l'éduCation)
Description: AMPIRIC (Aix-Marseille – Pôle d’Innovation, de Recherche, d’Enseignement pour l’Éducation) est porté par
Aix-Marseille Université (AMU) en partenariat avec l’académie d’Aix-Marseille, Avignon Université (AU) et
l’Université de Nice Sophia Antipolis (UNS). Les collectivités territoriales, des associations et des entreprises
sont associées et l’Association Nationale de la Recherche et de la Technologie (ANRT) s’engage dans un
partenariat exclusif de mise en réseau du Pôle avec les entreprises de l’EdTech.
AMPIRIC vise à améliorer les performances des élèves, notamment ceux qui sont en difficulté, dans leur
apprentissage des savoirs fondamentaux tout au long de leur parcours scolaire en développant
expérimentant, diffusant des approches pédagogiques innovantes fondées sur les technologies numériques.
Le projet vise à renforcer la mise en réseau entre terrain, formation et recherche. L’ensemble des actions du
pôle sont conçues dans cette perspective, fondée notamment sur des communautés de pratiques entre
équipes pédagogiques dans les établissements, de recherche dans les laboratoires et de production dans
les entreprises.
Le projet vise cinq objectifs stratégiques : (OS1) Transformer la formation et l’accompagnement des
enseignants pour faire évoluer leurs pratiques face aux défis liés aux apprentissages fondamentaux ; (OS2)
Favoriser les coopérations recherche-terrain en soutenant les recherches-actions et en faisant vivre des
communautés de pratiques ; (OS3) Améliorer notre compréhension des processus d’enseignementapprentissage
des savoirs fondamentaux en soutenant des recherches fondamentales, finalisées par les
besoins de l’éducation et de la formation ; (OS4) Coproduire des outils et des applications au service des
apprentissages fondamentaux au sein d’un CréativLab, et (OS5) Diffuser et valoriser les ressources
pédagogiques sur les apprentissages fondamentaux. Cinq actions permettent d’opérationnaliser ces cinq
objectifs.
Le dispositif d’évaluation et de mesure de l’impact du démonstrateur AMPIRIC repose sur un double suivi
longitudinal : d’une part, un suivi des performances d’apprentissage des élèves et, d’autre part, un suivi de la
professionnalité enseignante tout au long de la vie professionnelle, de l’entrée en 1e année de licence
jusqu’à la formation continue des professionnels en exercice. Dans un premier temps, le projet sera
expérimenté dans 8 réseaux académiques qui regroupent 535 écoles élémentaires, 97 collèges, 48 lycées
(généraux et technologiques, professionnels et polyvalents) et 3 campus des métiers de l’académie d’Aix-
Marseille. Dans un second temps, il s’élargira aux 13 autres réseaux académiques, à la région académique
PACA et à l’ÉSPÉ de l’académie de Nice.
Présentation du projet AMPIRIC (INSPE site d'Aix - 29/01/2020):
The ADNVideo Project
Description: The ADNVideo Project aims to develop multimodal tools for video analysis and recommendation. It focuses on jointly processing audio, speech transcripts, images, scenes, text overlays and user feedback. Using as starting point the corpus, annotations and approaches developed during the REPERE challenge, this project aims at going beyond indexing at single modalities by incorporating information retrieval methods, not only from broadcast television shows, but more generally on video documents requiring multimodal scene analysis. The novelty of our project is to combine and correlate information from different sources to enhance the description of the content.
Funding: The ADNVIDEO is funded in the framework of A*MIDEX.
Our Tasks: Contradictions Detection, Sentiments Analysis and Aspects Detection.
Work Overview (Datasets, Stats, Results, etc):Click Here
Social IR : Exploitation of social signals to enhance IR
Description: My research work focuses on social information retrievial (SIR). In this context, I am interested in ranking models to enhance IR in social networks and the Web. The problem of SIR that we want to solve during this project is to answer several questions:
1) The first concerns the development of tools to meet users needs:
- What are the information needs of social media users?
- What models of social information retrieval?
2) The second concerns the identification and exploitation of social information in IR tasks :
- Can these social signals or UGC help the underlying search systems for guiding their users to reach a better quality or more relevant content?
- How can we convert these UGC into social properties?
- What are the useful social properties to be taken into account to improve the resources search (e.g., Web pages, videos)?
- What is the impact of both emotionnel signals and comments sentiments on search ranking?
So, our contrubutions aim to estimate relevance of information through the qualitative, temporal and relationship properties. Thus, the analysis and comparison of communities and their properties and behaviors in a model of the type ≺ user, resource, action, time ≻
Here you can find a some news about computer science.
"Fake news ou infox" : lequel va s'imposer ?
Il y a une expression américaine qui est fort à la mode dans la presse française depuis la campagne présidentielle de Donald Trump, il s’agit de : "fake news". Pour tenter de couper l’herbe sous le pied à cet anglicisme, "qui désigne un ensemble de procédés contribuant à la désinformation du public", la Commission d’enrichissement de la langue française vient de proposer de le remplacer par un néologisme : "infox".
Le mot est assez bien trouvé selon moi. Reste à voir si la réaction a été suffisamment rapide pour que cette "infox", un mot-valise basé évidemment sur "info" et "intox", s’installe dans notre vocabulaire.
La Commission d’enrichissement de la langue est une émanation du ministère de la culture, créée en 1996. "Pour demeurer vivante, explique la Commission, une langue doit être en mesure d’exprimer le monde moderne dans toute sa diversité et sa complexité. Chaque année, dans notre monde désormais dominé par la technique, des milliers de notions et de réalités nouvelles apparaissent, qu’il faut pouvoir comprendre et nommer".
SIGIR 2018: Turning Clicks into Purchases: Revenue Optimization for Product Search in E-Commerce
Abstract: In recent years, product search engines have emerged as a key factor for online businesses. According to a recent survey, over 55% of online customers begin their online shopping journey by searching on an E-Commerce (EC) website like Amazon as opposed to a generic web search engine like Google. Information retrieval research to date has been focused on optimizing search ranking algorithms for web documents while little attention has been paid to product search. There are several intrinsic differences between web search and product search that make the direct application of traditional search ranking algorithms to EC search platforms difficult. First, the success of web and product search is measured differently; one seeks to optimize for relevance while the other must optimize for both relevance and revenue. Second, when using real-world EC transaction data, there is no access to manually annotated labels. In this paper, we address these differences with a novel learning framework for EC product search called LETORIF (LEarning TO Rank with Implicit Feedback). In this framework, we utilize implicit user feedback signals (such as user clicks and purchases) and jointly model the different stages of the shopping journey to optimize for EC sales revenue. We conduct experiments on real-world EC transaction data and introduce a a new evaluation metric to estimate expected revenue after re-ranking. Experimental results show that LETORIF outperforms top competitors in improving purchase rates and total revenue earned.
Authors:Liang Wu, Diane Hu, Liangjie Hong and Huan Liu