21 mars 2025 | Université de Nanterre

Robert Carvais ; Valérie Nègre ; Michela Barbot ; Josselin Morvan ; Emmanuel Château-Dutier ; Anna Bellavitis ; Valentina Sapienza ; Anne Conchon ; Valentin Chabaux ; Brian Chauvel ; Vincent Demont ; Guillaume Garner ; Davide Gherdevich ; Dominique Margairaz ; Corine Maitte ; Pauline Lemaigre-Gaffier ; Silvia Marzagalli ; Christine Plumejeaud-Perreau ; Robin de Mourat ; Guillaume Daudin ; Loïc Charles ; Paul Girard ; Claire Hanen ; Christian Bessy ; Laurent Feller ; Pierre Gervais

On n’y voit rien : sources, corpus et bases de données

À chaque base sa méthode ?

Présentation des bases « Experts », « Garzoni », « Portic », « Privilèges », « Toflit18 » ; sources utilisées et artefacts construits, statut et nature de chaque base.

Base privilèges : base de données sur les privilèges d’entreprise, possibilité d’entreprendre, à la différente des privilèges d’invention (dépôt de brevets).

Nature et fonctionnent des [relations ?] économiques. La période couverte est toute l’ère moderne, fin 15e - 19e. nécessite une approche quatittive. La base est multilingue. Mais c’erst un objet indéterminé. La termer privilège n’est pas une réalité diplomatique, sauf en Allemagne, ailleurs ce sont les lettres patentes, les décrets, etc. en revanche c’est une réalité juridique.

Quelles données ? elles sont le fruits d’un processus de fabrication que l’on peut décrire.

constitution d’un corpus d’acte que l’on a déterminé comme étant des sources. la sélection s’opère soit à l’aveugle par un balayage cursif des actes, soit par mots-clés, index réalisés par les contemporains, mais avec le risque que le sens ne soit pas le même que celui que nous entendons aujourd’hui. Certaines sources sont des

Nécessité d’alignement dans les données pour les exploiter.

Toflit18 idéed’utiliser les statistique du commerce extérieur français pour étudier une série de questions sur l’économie française et européenne la pré révolution industrielle. les données ont été construite à partir du bureau de la balance du commerce. Son objet était de collecter les données du commerce extérieur français.

Les données ne sont pas stables d’un document à un autre, dans certains on retrouve la valeur, mais pas le prix, parfois certains prix sont indiqués par le fermier général, puis quand ça passe dans les chambres de commerce, le prix peuvent être modifiés par ces dernières. Parfois les documents mentionnent les pays de provenance ou de destination, mais parfois aussi les villes.

Volonté de récupérer un maxium d’information [propre à chaque document ?]

On note une évolution temporelle, par exemple, au début près de 2000 catégories de marchandises, puis à la fin de la période plus que 200, de fait les quantités changent aussi.

Portic portic est une projet qui s’insrit dans la durée. projet qui réuni des économistes, des historiens et des informaticiens. Compléter les données utiliser et compléter les données de toplit18 Visualiser les incertitude des données historiques (données incoplètes imprecises ou contradictoire)

Deux gros corpus, les congés (sortie), et les registres de santé pour Marseille, qui ne sont pas qui était

Si on est chercheur c’est qu’on est contrôllant des données saisies.

Nécessité d’une interaction constante entre les agents pour que cela fonctionne.

Experts

Garzonni

Dans la salle des machines : expériences des humanités numériques

Présentation et discussion des outils utilisés pour la construction de chaque base de données, ainsi que des enjeux de pérennisation de ces bases.

Prouver par les données

Discutants : Christian Bessy | CNRS, ENS Paris-Saclay, IDHE.S et Laurent Feller | Université Paris 1, LAMoP

Table ronde 1. Traiter et interpréter : quels traitements quantitatifs et qualitatifs (croisements, agrégations, périodisation) ?

Table ronde 2. Visualiser et expliquer : quels livrables (cartes, graphiques, chronologies) pour quelles démonstrations ?

Table ronde 3. Transmettre et remployer : quel archivage des données ? Quels choix de mise à disposition : documentation, export, enrichissement des données ?