Yves Marcoux
Les documents structurés
Profile
Research expertise
Depuis mon arrivée dans le monde académique, je m'intéresse aux documents structurés (XML et consorts) comme mode de représentation de l'information. Ces formalismes permettent – et exigent – un maillage unique de la langue naturelle (les « contenus ») et d'éléments lexicaux purement formels (le « balisage ») qui est étranger aux autres modèles courants de représentation de l'information et des connaissances. Je suis fasciné par cette hybridité, qui permet de déplacer presque en continu la frontière contenu-contenant pour la mouler à l'information à gérer avec autant de précision que l'on veut.
Mes recherches portent principalement sur deux aspects des documents structurés :
- Les langages de balisage eux-mêmes, en particulier leur puissance expressive, c'est-à-dire l'ensemble des structures informationnelles qu'ils peuvent représenter. Je m'intéresse notamment à la comparaison de langages admettant des structures avec chevauchement ("overlapping structures"), impossibles à représenter en XML. Un des projets auxquels je collabore à ce chapitre est le MLCD Overlap Corpus, réalisé conjointement avec le Professeur Claus Huitfeldt, de l'Université de Bergen (Norvège) et Michael Sperberg-McQueen (co-créateur de la Text Encoding Initiative et co-éditeur de la spécification XML du W3C), de Black Mesa Technologies (États-Unis).
- La mise en œuvre des technologies liées aux documents structurés, en particulier les méthodologies de mise sur pied de systèmes d'information basés sur ces technologies. À ce chapitre, je développe depuis 2005, avec le Professeur Élias Rizkallah, de l'UQAM, un cadre sémantique pour les documents structurés basé sur langue naturelle : la sémantique intertextuelle (SI). La SI, qui s'inscrit dans le courant des approches sémiotiques au design, est un outil qui permet à toutes les parties prenantes collaborant à la mise sur pied – et même à l'opération – d'un système, de communiquer efficacement sur le plan sémantique, autrement dit de « bien se comprendre ». Le but visé est l'adéquation entre le système mis sur pied et les besoins et caractéristiques de la collectivité d'utilisateurs visée; autrement dit l'utilisabilité du système et, partant, la qualité de l'expérience utilisateur. Actuellement, le principal terrain d'expérimentation de la SI est le projet de Cyberjustice du Professeur Karim Benyekhlef du Centre de recherche en droit public et de la Faculté de droit de l'Université de Montréal.
Bien que développée dans le contexte des documents structurés, la sémantique intertextuelle (SI) est en principe applicable à l'élaboration de n'importe quel artéfact communicationnel (production sémiotique). Je réfléchis donc aussi à l'applicabilité de la SI et à son apport potentiel dans d'autres domaines, comme par exemple les bases de données relationnelles, les vocabulaires contrôlés et les interfaces-utilisateur.
Affiliations and responsabilities
Teaching and supervision
Student supervision
Theses and dissertation supervision (Papyrus Institutional Repository)
Application de la sémantique intertextuelle à la modélisation de constats d'infraction de la ville de Québec
Cycle : Master's
Grade : M.S.I.
La transposition numérique de l'édition critique : éléments pour une édition de l'Isopet 1- Avionnet
Cycle : Doctoral
Grade : Ph. D.
Conception d’une application intégrée d’aide à la gestion des connaissances pour une PME de consultants travailleurs du savoir.
Cycle : Master's
Grade : M.S.I.
Projects
Research projects
REPENSER LE DROIT PROCESSUEL : VERS UNE CYBERJUSTICE
Plateformes numériques en contexte interculturel
Coming within reach of software interoperability in qualitative data analysis: an international initiative
Outreach
Publications and presentations
Publications
Pour consulter les publications d'Yves Marcoux : https://marcoux.ebsi.umontreal.ca/publi/publi.html
Disciplines
- Archive and Library Sciences
- Computer Science
Areas of expertise
- Intertextual semantics
- Communication design
- Document theory
- Structured documents
- Document markup languages
- Overlapping markup