Houda Saadane

Dans cet article, nous nous interessons a la translitteration des noms arabes de leur ecriture originale vers l'ecriture latine. Ce type de technique est necessaire pour la recherche d'information interlingue afin de renvoyer des... more

Dans cet article, nous nous interessons a la translitteration des noms arabes de leur ecriture originale vers l'ecriture latine. Ce type de technique est necessaire pour la recherche d'information interlingue afin de renvoyer des resultats pertinents. Le principe de notre approche est de proposer toutes les variantes orthographiques d'un nom arabe et non pas la meilleure solution. Nous avons montre l'interet de notre approche par une serie d'experimentations et en comptant a chaque fois le nombre de (...)

Publication Date: 2014

Download (.pdf)

Publication Date: 2012

Publication Name: 2012 6th International Conference on Sciences of Electronics, Technologies of Information and Telecommunications (SETIT)

Research Interests:
Geology, Information Retrieval, Natural Language Processing, Pragmatics, Arabic, and 5 moreProper Names, Transcription, Organizations, Dictionaries, and Internet

Algerian Arabic is an Arabic dialect spoken in Algeria characterized by the absence of writing resources and standardization, hence it is considered as an under-resourced language. It differs from Modern... more

Algerian Arabic is an Arabic dialect spoken in Algeria characterized by the absence of writing resources and standardization, hence it is considered as an under-resourced language. It differs from Modern Standard Ara-
bic on all levels of linguistic representation, from phonology and morphology to lexicon and syntax. In this paper, we present a conventional orthography for Algerian Arabic, following a previous effort on developing a conventional orthography for Dialectal Arabic (or CODA), demonstrated for Egyptian and Tunisian Arabic. We explain the design principles of Algerian CODA and provide a detailed description of its guidelines.

Research Interests:
Arabic Dialects, Orthography, Algerian Arabic, and Arabic Maghrebi dialectology

Download (.pdf)

Dans cet article, nous nous intéressons à la translittération des noms arabes de leur écriture originale vers l'écriture latine. Ce type de technique est nécessaire pour la recherche d'information interlingue afin de renvoyer des... more

Dans cet article, nous nous intéressons à la translittération des noms arabes de leur écriture originale vers l'écriture latine. Ce type de technique est nécessaire pour la recherche d'information interlingue afin de renvoyer des résultats pertinents. Le principe de notre approche est de proposer toutes les variantes orthographiques d'un nom arabe et non pas la meilleure solution. Nous avons montré l’intérêt de
notre approche par une série d’expérimentations et en comptant à chaque fois le nombre de résultats obtenues par des moteurs de recherche après la transcription via notre technique.

Download (.pdf)

Dans cet article, nous nous intéressons à l’utilisation de la translittération arabe pour l’amélioration des résultats d’une approche linguistique d’alignement de mots simples et composés à partir de corpus de textes parallèles... more

Dans cet article, nous nous intéressons à l’utilisation de la translittération arabe pour l’amélioration des résultats d’une approche linguistique d’alignement de mots simples et composés à partir de corpus de textes parallèles français-arabe. Cette approche utilise, d’une part, un lexique bilingue et les caractéristiques linguistiques des entités nommées
et des cognats pour l’alignement de mots simples, et d’autre part, les relations de dépendance syntaxique pour aligner les mots composés. Nous avons évalué l’aligneur de mots simples et composés intégrant la translittération arabe en utilisant deux procédés :
une évaluation de la qualité d’alignement à l’aide d’un alignement de référence construit manuellement et une évaluation de l’impact de cet alignement sur la qualité de la
traduction en faisant appel au système de traduction automatique statistique Moses. Les résultats obtenus montrent que la translittération améliore aussi bien la qualité de l’alignement que celle de la traduction.

Download (.pdf)

In this paper, we focus on the use of Arabic transliteration to improve the results of a linguistics-based word alignment approach from parallel text corpora. This approach uses, on the one hand, a bilingual lexicon, named entities,... more

In this paper, we focus on the use of Arabic transliteration to improve the results of a linguistics-based word alignment approach from parallel text corpora. This approach uses, on the one hand, a bilingual lexicon, named entities, cognates and grammatical tags to align single words, and on the other
hand, syntactic dependency relations to align compound words. We have evaluated the word aligner integrating Arabic
transliteration using two methods: A manual evaluation of the alignment quality and an evaluation of the impact of this
alignment on the translation quality by using the Moses statistical machine translation system. The obtained results
show that Arabic transliteration improves the quality of both alignment and translation.

Download (.pdf)

Bilingual lexicons of proper names play a vital role in machine translation and cross-language information retrieval. Word alignment approaches are generally used to construct bilingual lexicons automatically from parallel corpora.... more

Bilingual lexicons of proper names play a vital role in machine translation and cross-language information retrieval. Word alignment approaches are generally used to construct bilingual
lexicons automatically from parallel corpora.
Aligning proper names is a task particularly difficult when the source and target languages of the parallel corpus do not share a same written script. We present in this paper a system to transliterate automatically proper names from Arabic to Latin script, and a tool to align single and compound words from English-Arabic parallel texts. We particularly focus on the impact of using transliteration to improve the performance of the word alignment tool. We have evaluated the word alignment tool integrating transliteration of proper names from Arabic to Latin script using two methods: A manual evaluation of the alignment quality and an evaluation of the impact of this alignment on the translation quality by using the open source statistical machine translation system Moses. Experiments show that integrating transliteration of proper names into the alignment process improves the Fmeasure
of word alignment from 72% to 81% and the translation BLEU score from 20.15% to 20.63%.

Download (.pdf)

Nous présentons dans cet article un système d'extraction de connaissances en arabe, fondé sur une analyse morphosyntaxique profonde. Ce système reconnaît les mots simples, les expressions idiomatiques, les mots composés et les entités... more

Nous présentons dans cet article un système d'extraction de connaissances en arabe, fondé sur une analyse morphosyntaxique profonde. Ce système reconnaît les mots simples, les expressions idiomatiques, les mots composés et les entités nommées. L'analyse identifie aussi les relations syntaxiques de dépendance et traite les formes passives et actives. L’extraction des connaissances est propre à l’application et utilise des règles d’extraction sémantiques qui s'appuient sur le résultat de l'analyse morphosyntaxique. A ce niveau, le type de certaines entités nommées peut être révisé. L'extraction se base, dans nos expérimentations, sur une ontologie dans le domaine de la sécurité. Le RDF (Resource Description Framework) produit est ensuite traité pour regrouper les informations qui concernent un même événement ou une même entité nommée. Les informations ainsi extraites peuvent alors aider à appréhender les informations contenues dans un ensemble de textes, alimenter une base de connaissances, ou bien servir à des outils de veille.

Download (.pdf)

La langue arabe est caractérisée par une situation de diglossie, il existe une pluralité de l’arabe, d’une part, l’arabe classique et l’arabe moderne standard qui a été le sujet de nombreux travaux de recherche et d’autre part, l’arabe... more

La langue arabe est caractérisée par une situation de diglossie, il existe une pluralité de l’arabe, d’une part, l’arabe classique et l’arabe moderne standard qui a été le sujet de nombreux travaux de recherche et d’autre part, l’arabe dialectal qui est une langue peu dotée et présente des variations d’un pays à un autre et voire d’une ville à une autre. Dans cet article, nous nous intéressons à la reconnaissance automatique des dialectes arabes à l’écrit. Dans un premiers temps, nous avons
cherché à constituer un corpus de textes dialectaux rédigés en caractères latins. Ensuite, nous avons employé un outil de translittération pour les retranscrire en arabe. Enfin, nous avons extrait les traits morphosyntaxiques et sémantiques caractéristiques de deux principaux groupes de dialectes, à
savoir le Maghreb et le Machrek .

Download (.pdf)

Publication Date: 2014

Publication Date: 2012

Publication Name: 2012 6th International Conference on Sciences of Electronics, Technologies of Information and Telecommunications (SETIT)

Research Interests: Arabic Dialects, Orthography, Algerian Arabic, and Arabic Maghrebi dialectology<div>()</div>

Log In

Research Interests:
Arabic Dialects, Orthography, Algerian Arabic, and Arabic Maghrebi dialectology