Revenir à la page d'accueil du Wiki de l'ARHN
Les séances du séminaire se déroulent en hybride et sont ouvertes à toutes et tous sur inscription préalable auprès de vincent.alamercery@ens-lyon.fr. Précisez lors de votre inscription si vous souhaitez suivre la séance en visio pour recevoir le lien.
Kraken, eScriptorium et l'ATR (automatic text recognition) : Naviguer dans les Océans de la Reconnaissance Automatique d’Écriture
L’émergence d’outils de reconnaissance automatique d’écriture avec une interface utilisateur de plus en plus intuitive, tels que Transkribus ou eScriptorium, ouvre aujourd’hui de nouvelles perspectives. De nombreuses équipes de recherche se sont lancées dans l'utilisation de l'ATR et l’entraînement de modèles de plus en plus performants sur les sources historiques, capables de reconnaître efficacement une grande variété de documents qu'ils présentent des écritures différentes, ou qu’ils proviennent de périodes historiques et d’aires linguistiques variées, modernes comme médiévales. Toutefois, malgré les progrès significatifs réalisés, des défis subsistent pour le traitement des documents historiques complexe ? Comment obtenir des transcriptions automatiques qui respectent des critères scientifiques ? Comment analyser la mise en page ? En conclusion, si la reconnaissance automatique d’écriture offre la possibilité d'explorer des tailles de corpus inédites, elle requiert toujours une certaine expertise pour relever les défis inhérents à la diversité et la complexité des documents médiévaux, limites et enjeux que nous aborderons dans cette présentation.
Extraire du texte des imprimés anciens : quels défis, quelles promesses ? Illustration par le projet AGODA
Intégralement retranscrits dans le Journal Officiel depuis 1881, les débats parlementaires anciens constituent des sources précieuses pour l'histoire. Ces documents numérisés et accessibles via Gallica, restent toutefois difficiles d'accès. Durant cette présentation, Marie Puren évoquera les défis rencontrés par le projet AGODA pour traiter et rendre accessibles ces documents.
Records in Contexts 1.0, un modèle et une ontologie pour FAIRIser les métadonnées archivistiques et favoriser l'utilisation des archives par les chercheurs
Après plusieurs années de travail, le groupe d'experts sur la description archivistique (EGAD) de l'International Council on Archives (ICA) a publié fin 2023 la version 1.0 du modèle conceptuel et de l'ontologie Records in Contexts (RiC) (voir l'annonce faite ici, et les liens qu'elle fournit : https://www.ica.org/fr/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/). Avec le nouveau standard RiC, la communauté des archivistes et les professionnels qui travaillent avec eux (SSII, ingénieurs et chercheurs en SHS notamment) disposent aujourd'hui d'un cadre de référence pour structurer les métadonnées de description des archives comme des graphes d'entités liées, et, s'ils le souhaitent, pour représenter ces graphes sous la forme de jeux de données RDF afin de les publier dans le web de données. La présentation permettra d'évoquer les enjeux d'une telle évolution en particulier pour ce qui concerne les utilisateurs finaux de ces métadonnées, de donner un aperçu, en les illustrant d'exemples, des principales caractéristiques de RiC-CM et de RiC-O 1.0, de la feuille de route du groupe EGAD après cette publication notamment en ce qui concerne l'articulation de RiC avec d'autres modèles, et d'évoquer rapidement les premières implémentations qui ont vu le jour ces derniers temps.
Analyser les trajectoires socioprofessionnelles d'ouvriers gantiers et métallurgistes grenoblois à l'aide des outils numériques : enjeux et méthodes
Cette intervention est liée à une recherche doctorale qui se donne pour objectif d’analyser les déterminants familiaux et individuels de l’évolution des activités économiques à l’échelle du territoire grenoblois, en articulant les dimensions macroscopiques et les trajectoires socioprofessionnelles d’ouvriers gantiers et métallurgistes. Après avoir posé le contexte et les problématiques, il s’agira de revenir sur les sources, les méthodes et les outils employés pour analyser les cohortes de travailleurs constituées.
Les séances du séminaire se déroulent en hybride et sont ouvertes à toutes et tous sur inscription préalable auprès de vincent.alamercery@ens-lyon.fr. Précisez lors de votre inscription si vous souhaitez suivre la séance en visio pour recevoir le lien.