Au cours d’un travail de deux années réalisé au LIEPP (Laboratoire Interdisciplinaire d’Evaluation des Politiques Publiques) à Sciences Po, nous avons collecté et analysé des données sur 1 243 776 personnages notables (notable people) et 7 184 575 lieux auxquels ils sont directement liés et localisés par leurs longitude et latitude (Geolinks) à travers l’histoire (3000 avant J.-C. jusqu’en 2015). Le travail est continuellement mis à jour sur le site dédié brief-history.eu.
Cette approche a été initiée en 2014 par Maximilian Schich, de l’université du Texas, et son équipe, qui ont récupéré les lieux et années de naissance et de décès de 120 211 personnages à partir de Freebase, une base de données de Google. En 2015, David de la Croix et Omar Licandro ont construit un échantillon de 300 000 personnes nées entre l’époque de Hammurabi (environ 1600 avant J.-C.) et 1879, l’année de naissance d’Einstein. Cela à partir de l’Index Bio-bibliographicus Notorum Hominum. Et cette année, Yu Amy Zhao et son équipe ont également utilisé Freebase et construit une base de données vérifiée ligne à ligne pour 11 341 biographies dans plus de 25 langages sur Wikipedia.
Notre article étend ces approches. Nous avons compilé la plus grande base possible plutôt que de se concentrer seulement sur les « célébrités mondiales ». En effet, notre intuition est que le développement économique dépend tout autant, si ce n’est plus, des centaines de milliers de personnages « significatifs » de Freebase que des seuls personnages les plus connus de la base (top décile).
Il semble d’ailleurs que la pondération des individus par différentes mesures de leur visibilité ne fasse pas une grande différence ; ce qui justifie ex post notre collecte d’information à grande échelle de centaines de milliers d’individus (artistes, entrepreneurs, politiciens, etc.).
L’article décrit en détail la méthodologie et les procédures d’extraction de l’information pertinente à partir de la base communautaire Freebase recensant des individus et en appariant de façon automatique ces informations à leurs pages Wikipedia. Il analyse ensuite la base. Voici ce qui émerge :
Dix faits principaux
- Il y a une croissance exponentielle de la base, avec plus de 60 % de personnalités encore en vie en 2015, à l’exception d’un déclin relatif des cohortes nées au XVIIe siècle avec un minimum entre 1645 et 1655.
- La durée de vie de ces personnages a augmenté de 20 ans environ, de 60 jusqu’à un peu moins de 80 ans, entre la cohorte née en 1400 après J.-C. et celle née en 1900.
- La part des femmes dans la base présente une courbe en U, avec un minimum au XVIIesiècle et atteint 25 % pour les cohortes les plus récentes.
- La part des personnages dans la catégorie Gouvernance(politique, religieux, militaire, noblesse) a diminué au cours du temps et la part dans les activités artistiques, littéraires, média et sport a augmenté dans le même temps ; le sport a rattrapé la catégorie arts/littérature/média pour les cohortes nées en 1870 et ensuite restées au même niveau jusqu’aux cohortes nées en 1950 ; puis la catégorie « sport » domine la base de données après 1950.
- Les 10 personnalités les plus visibles nées avant 1890 sont toutes non américaines et ont 10 nationalités différentes. En revanche, six des 10 personnalités nées après 1890 sont des citoyennes américaines. Depuis 1800, la part des personnages nés en Europe et aux États unis diminue et le nombre de personnes d’Asie et de l’hémisphère sud augmente pour atteindre 20 % de la base en 2000. Le barycentre (centre de gravité) de la base se situait entre la Grèce et la Turquie entre 2000 avant J.-C. et 500 après J.-C., puis se déplace vers l’Ouest. Le centre se trouvait dans le nord-est de la France entre 1500 et 1700. Avec le peuplement de l’Amérique du Nord, ce dernier s’est déplacé dans l’Atlantique, au large des côtes françaises et espagnoles.
- La distance moyenne entre le lieu de naissance et celui de décès suit une courbe en U : la distance moyenne était de 316 km avant 500 après J.-C., de 100 km entre 500 et 1500, et a augmenté continûment depuis. La plus grande part de cette distance est franchie entre les âges de 15 ans et de 25 ans.
- Les individus les plus visibles sont les plus distants de leur lieu de naissance, avec une distance médiane de 785 km pour le 1 % des individus de l’histoire les plus visibles, à comparer avec 389 km pour les 10 % les plus visibles et 176 km pour l’ensemble de ces personnages.
- Dans toutes les activités, on observe une augmentation de la mobilité internationale depuis 1960. La part des lieux visités situés dans un pays différent du pays de naissance est passée de 15 % en 1955 à 35 % après 2000. Mais dans le passé, des individus célèbres ont été très mobiles : par exemple Érasme, dont les lieux visités et automatiquement détectés par notre algorithme sont représentés ci-dessous.
- Il n’y a pas de corrélation positive entre la taille des villes et la visibilité des individus mesurée en 2015. Cette corrélation serait même plutôt négative. Ces premiers résultats descriptifs nous renforcent dans l’idée qu’il est important de tenir compte dans les analyses ultérieures de l’ensemble des personnages de Freebase et pas uniquement des plus connus (top décile).
- Enfin, sur la période 1800-1939 analysée dans cette version 1.0 du texte, **il existe une corrélation positive et stable entre le nombre d’entrepreneurs à une date donnée et la croissance urbaine de la ville où ils sont localisés au cours de la décennie suivante ; de façon plus inattendue, c’est également vrai du nombre d’artistes à une date donnée qui est positivement associé à sa croissance les années suivantes ; en revanche, on trouve une corrélation nulle ou négative entre le nombre de « gouvernants » (politiques, militaires, religieux et noblesse) et la croissance des décennies suivantes.