Web et écritures historiennes

 Ecrire le réseau, écrire pour ou avec le réseau, une perspective dynamique.

Ecole d'été méthodes digitales, Ensib, 09/2013

Les notes ci-dessous ont servi de support à l'intervention du 16 septembre 2013.

Intro

Je voudrais aujourd'hui vous proposer plutôt qu'un exposé introductif tout à fait léché un parcours un peu méandreux. Il y a cela deux raisons La dernière fois que j''ai publié un texte consacré aux écritures historiennes à l'âge numérique, un historien, lyonnais d'ailleurs, m'a dit que tout cela était beaucoup trop théorique et difficilement accessible pour le public d'historiens auquel le texte était destiné. Il n'avait pas tort, en même temps je demeure profondément convaincu que pour comprendre ce qui nous arrive, c'est à dire les rapides mutations de nos pratiques professionnelles, nous avons besoin, sinon de théorie, du moins d'un détour par l'abstraction. Donc je me suis dit qu'il me fallait partir de quelque chose de très simple et de très concret pour montrer qu'il fallait pour le penser efficacement un détour par l'abstraction.
Et puis j'ai regardé le programme de cette école d'été, allêchant la liste des intervenants, impressionnante et j'ai eu un moment d'hésitation. Nous sommes dans les différents champs des sciences sociales confrontés à des mutations qui se ressemblent, donc je risquais de raconter un peu la même chose que tous mes collègues, à la différence près que mes exemples proviendraient des sciences historiques, et du coup de gommer un peu les écarts entre les différentes approches des sciences humaines, qui ont chacune leur voix propre. Donc j'ai cherché le moyen de ne pas parler des écritures numériques des historiens comme un spécialiste des sciences de la communications, ce que d'ailleurs je ne suis pas, mais de m'exprimer en historien.
Et là, je me suis dit bon sang mais c'est bien sûr. Il me faut un matériau, des régimes de temporalité, des sources quoi, pour me permettre de raconter une histoire en partant de choses très simples. D'une certaine façon ça tombe bien, parce que des sources permettant d'évoquer les écritures numériques historiennes, nous en avons plein, et il y en a que je connais bien, parce que je les ai produites et qu'elles concernent des choses très simples.

Trois âges de l'écriture en réseau

Ecrire le web

Soit donc un un historien qui produit des textes nativement numériques dans le cadre de son activité scientifique. Il y a une bonne quinzaine d'années cela donne quelque chose comme le site clio. http://web.archive.org/web/20000818231633/http://barthes.ens.fr/clio/
Ce n'est pas très joli et l'actualité du contenu n'est plus ce qu'elle était, mais ce qui va m'intéresser ici, que je vais prendre comme source n'est pas sous nos yeux, caché mais pas bien loin. Sous cette page en effet il y a un texte, enfin disons une chaîne symbolique. Et il y a quinze ans écrire pour le web c'est très littéralement écrire le web, c'est à dire ouvrir un éditeur de texte et commencer à taper cette chaîne. Ce n'est pas coder, et je crois ici que la précision est importante, mais écrire un texte que l'on va baliser, exactement comme aujourd'hui on utilise le xml pour éditer un texte. Et puis il faut construire aussi l'architecture des fichiers et celle des contenus, parce qu'il n'y a pas à l'époque de personnage qui prenne en charge ces fonctions quand on veut arriver à diffuser de manière électronique du contenu.
En termes de compétences, cela suppose de connaître un langage de description qui s'appelle le Html, être capable de se connecter à un serveur ftp, ouvrir une connexion ssh, donc être capable de taper quelques lignes de commande et bien maîtriser les notions liées à la construction d'une arborescence. En 1996/1997 si vous êtes dotés de ces compétences vous êtes dans le contexte des sciences sociales de langue française un geek. Il doit y avoir alors une demi douzaine d'historiens qui pratiquent ce genre de choses.
Ces compétences d'ailleurs ne suffisent pas à créer un contenu accessible, il faut aussi être en contact avec un administrateur réseau  ou le responsable d'un serveur convaincu que vous n'allez pas gaspiller de l'espace disque ou de la bande passante avec vos fichiers qui ne sont pas vraiment de la science. A l'époque c'est peut-être le plus compliqué.
Tout cela paraît un peu antique et rudimentaire, mais cela suffit déjà à faire beaucoup de choses. Il est possible de gérer des listes de diffusion, de proposer accès à des baess de données, sauf que pour ce faire il faut soit acheter une licence très cher, soit avoir une vraie compétence en matière de programmation, ou bien, ce que je faisais à l'époque gérer de la base de données en local et publier des états en html.
Il est aussi possible de mettre en place assez facilement des dispositifs interactifs, les formulaires et la fonction get ont là pour ça. La seule difficulté est qu'il n'y a pas beaucoup d'utilisateurs et que la plupart découvrent un univers qui leur est tout à fait étranger. De fait les interactions passent souvent beaucoup par le mail, et l'on découvre alors qu'un site savant génère parfois beaucoup de courriers, c'est à dire qu'il est une plate forme d'interaction, et peut-être surtout cela, pour un collectif assez complexe en ses formes.

Scripter

Je saute maintenant quelques années. Nous sommes en 2005. Un site savant d'histoire alors ça ressemble souvent au site d'une revue d'histoire telle que {Le Mouvement social, ici à l'été 2003, http://web.archive.org/web/20030802052615fw_/http://biosoc.univ-paris1.f.... La première remarque est que nous avons désormais affaire à une institution de la recherche et non plus à un réseau informel de jeunes chercheurs. Nous sommes passés du fanzine ou du bulletin au site attaché à une institution. Cela correspond à une évolution plus générale, qu'il faudrait une enquête pour décrire avec plus d'exactitude, mais la multiplication des sites attachés à une institution de recherche est bien là l'une des nouveautés de la première moitié de la décennie écoulée.

L'évolution du design et de l'ergonomie est assez nette. Nous arrivons en quelques années à une forme très proche des normes actuelles. On reconnaît la région centrale qui renferme l'information spécifique à la page, le bandeau de navigation supérieure sous forme d'un menu déroulant, les deux bandeaux latéraux réservés pour les renvois externes. Vous aurez cependant compris que ce ne sont pas aujourd'hui ces choses là qui m'intéressent le plus, mais ce que je peux lire des pratiques dans le code.

Ce qui frappe d'abord est que celui-ci est beaucoup plus touffu que le précédent, et beaucoup plus long que le précédent. Il est aussi de nature un peu différente. Celui-ci fait appel à deux codages de plus, nous avons ici des traces de java script, et une référence à des feuilles css externes. Cela renvoie là à l'évolution de normes et de pratiques tout à fait hétéronomes au champ historique, d'une part la dissociation accrue du contenue informationnel et de sa mise en forme, d'autre part la multiplication de scripts permettant un affichage changeant en fonction des actions du lecteur, enfin la diffusion de normes de bonnes pratiques venues de l'univers de l'écriture logicielle. Nous pourrions lier certaines de ces évolutions à des transformations techniques, l'usage accru d'éléments images et de scripts correspond en effet à la généralisation des connexions permanentes haut début, le passage en fait des connexions modem aux connexions adsl qui font abandonner l'obsession des premiers temps qui était celle de la légéreté des codes et des pages.

Si je prends le point de vue du producteur, je dirai que l'activité de production exige alors à la fois l'acquisition de compétences supplémentaires, un langage de script est plus complexe à mettre en oeuvre qu'un langage de description. Cela s'accompagne d'une routinisation des tâches qui est liée à un changement d'échelle et d'une redéfinition des rôles. Un personnage nouveau apparaît qui est le webmestre, qui n'est pas l'administrateur réseau mais qui tend à défendre vivement l'exclusivité de l'accès au secteur du serveur dont il a la responsabilité et être le garant d'une charte graphique ou d'une homogénéité des codes utilisés. La production de la ressource de plus est insérée dans la politique globale de communication de l'institution, globalement à l'époque terriblement prudente et hésitante tant pour ce qui est de la détermination des contenus à mettre en ligne que quant aux formes de celles-ci.

D'une certaine façon du point de vue du scripteur, la production de ressource électronique soit disparaît de son horizon, puisque prise en charge par des intervenants dont il est le fournisseur et non l'interlocuteur, soit perd tout intérêt puisque coûteuse en temps et sans vertu réflexive.

Ecrire pour le web

Venons en à aujourd'hui, où plutôt à l'une des formes possibles de l'écriture savante contemporaine. Les productions électroniques des revues sont généralement prises en charge par des portails donc des intervenants extérieur au champ disciplinaire, inaugurant une relation symbiotique entre des entreprises privées ou publiques et les communautés savantes qui sont en cours de redéfinition, mais ce sont là d'autres logiques que celles qui nous intéressent aujourd'hui. L'écriture numérique des chercheurs, dans le domaine de l'histoire comme en d'autres tend à prendre la forme du blog, que celui-ci soit personnel ou corresponde à l'activité d'un petit groupe de projet.
Les sites de ce type ont souvent un air de famille, que l'on comprend vite lorsque l'on regarde le code de l'un de ceux-ci. La encore je me permets d'utiliser un de mes codes, parce que cela me permet d'en dire tout le mal nécessaire si j'en ai besoin.

Nous nous apercevons assez vite que que ce code est substantiellement différent des précédents. Nous sommes dans un site dynamique, généré au moyen d'un CMS, Drupal en l'espèce mais nous aurions quelque chose de très similaire si nous regardions un site fabriqué avec Spip, ou Typo 3. L'architecture en effet est dans tous les cas similaire, reposant sur un coupage de scrpts php et de base de données sql, dont nous lisons la trace en ce code. Le résultat le plus spectaculaire en est la prolifération du code. Il faut ici environ 600 lignes pour afficher un mot de bienvenue de dix lignes. Là encore nous pouvons lier cela à des évolutions techniques et industrielles. Le fonctionnement de sites de ce type suppose en effet une forte activité processeur, l'affichage d'une page pouvant nécessiter le traitement de dizaines ou de centaines de requêtes, façon de rappeler que les pratiques scientifiques en environnement numériques ne sont pas audodéterminées. Cela veut dire d'ailleurs qu'il nous faudrait, si nous voulions être précis nous interroger sur les cheminements des outils développés en dehors de nos communautés scientifiques et adoptées par elle, si nous voulions comprendre certaines des logiques aujourd'hui en oeuvre. Wordpress, Drupal ou Spip, pour n'évoquer que certains des plus communs n'ont pas émergé au sein des communautés de sciences humaines, pas plus qu'ils n'ont été conçus pour en favoriser les pratiques. Les premiers sites ainsi pour lesquels Spip a été élaboré sont des sites d'éditeurs ou d'entreprises de presse (spip 2010)
 Ces outils tendent de ce fait à incorporer des modèles de distribution des tâches, distinguant des rôles qui tendent à reproduire les formes de la division du travail caractérisant ces industries dont l'une des manifestations est un rapport différencié au code et au serveur, codant au sens propre, des fonctions, dont nous sommes tentés d'écrire qu'elles ont de fortes chances d'apparaître comme une quasi nature aux utilisateurs, qui serait imposée par la technique même et non le produit de choix de programmation ou de paramétrage. De fait nous tendons aujourd'hui à distinguer des contributeurs, qui, par le biais d'une interface graphique reproduisant ou à peu près l'aspect d'un logiciel de traitement de textes, vont déposer un texte en langue naturel, sans rapport ni nécessairement conscience des transformations que celui-ci va subir avant d'apparaître sur un écran. L'administrateur du site lui, s'il a en charge la structuration des contenus peut gérer l'affichage, les accès des utilisateurs par le moyen d'une interface graphique, sans qu'il lui soit besoin de maîtriser un langage informatique ou d'écrire une ligne de code. En somme il déclenche la génération d'un code mais ne l'écrit plus. La production du code informatique est redevenue dans une large mesure l'apanage de communautés informaticiennes qui co-produisent les machines logicielles qu'actionneront les utilisateurs/contributeurs. L'envers en somme de ce qui est souvent présenté comme une libération ou une démocratisation de l'accès à l'écriture en réseau est une très stricte taylorisation qui assigne au moyen d'écritures non pas invisibles mais rarement vues les utilisateurs à des rôles souvent strictement définis par les opérateurs.
La logique de ces évolutions a la encore peut à avoir avec une quelconque spécificité disciplinaire, renvoyant à l'évolution d'une organisation productive qui permet d'économiser une compétence informatique relativement rare en l'incorporant dans des machines logicielles actionnées par des opérateurs semi-qualifiés permettant de produire à moindre frais, du moins en économisant le travail une multitude de micro ou de mini sites standardisés.

Nous sommes de ce fait observant, rapidement, une certaine forme d'écriture électronique historienne, disons les sites savants émanant de chercheurs individuels ou de petits collectifs d'agents patentés, confrontés à un complexe régime de temporalité. La possibilité d'une écriture savante en réseau introduit bien sûr des ruptures, ne serait-ce que par la prodigieuse diminution, pour le producteur, du coût de dissémination de l'information et l'accélération de sa transmission. De ce point de vue, d'autres aussi, il est possible d'associer l'ouverture de la possibilité de l'écriture en réseau à des seuils. Il est de fait fort probable que l'on pourrait tracer pour décrire ces valeurs des fonctions continues par intervalle.

Fonctionnellement cependant, ces sites savants, qui ne sont nullement d'ailleurs la seule forme de présence historienne en réseau s'inscrivent aisément dans des histoires très longues qui sont celles par exemple de la communication et des échanges au sein des communautés savantes, ou bien des revues. L'enjeu en effet pour la plupart de ces sites demeure la sélection, la qualification et la dissémination de l'information au sein de groupes relativement restreints de spécialistes et d'étudiants, mais aussi la mise en relation, nous disons aujourd'hui en réseau de mico-sociétés.

La vision cependant d'une histoire qui se déploierait comme le récit d'une rupture au sein d'une histoire longue semble cependant à la lumière de ces observations particulièrement réducteur. La multiplicité en effet des rôles et des postions dont tant les contenu que la distribution ont connu et connaissent des évolutions contrastées et pas toujours linéaire conduit à penser que la perception des dynamiques à l'oeuvre est probablement fortement différenciée. Nous avons ainsi croisé en quelques minutes, des contributeurs, des administrateurs, des propriétaires aussi de serveurs, et à une autre échelle, des industriels, des marchands, des états, toute une épaisseur sociale et technique dont l'oubli est la condition même de l'ébahissement fréquent devant les objets numériques présents dans notre quotidien. Si nous ne nous intéressons ainsi qu'au producteur historien de ressources électroniques contribuant à un site savant, nous dirions que s'il a du durant une petite dizaine d'années faire face à des situations exigeant une forte montée en compétences, il tend à devenir un simple fournisseur de chaînes de caractères servant des machines logicielles dont l'appropriation est de fait impossible à la quasi totalité des opérateurs, ce qui conduit à s'interroger, du point de vue du producteur, sur la pérennité et l'accessibilité des documents ainsi produits.

Enjeux situés

Eres et périodes

En ce sens, il n'y pas d'ère numérique qui se distinguerait radicalement par des propriétés stables des précédentes, mais un processus de numérisation du monde, au déroulé incertain, particulièrement localement, qui structure, profondément, notre univers, mais dont l'appréhension n'est véritablement possible qu'en situation et en contexte. De cela découle que parler des enjeux du numérique n'a guère de sens en soi, tant celui-ci ne peut être appréhendé qu'en des situations définies par des positions et des moments.
Donc si je veux parler de l'histoire en environnement numérique, je suis obligé, sous peine de travestir en énoncé scientifique un discours normatif, de spécifier une position.
Ce dont je parle en fait quand j'évoque les écritures historiennes en environnement numérique, ce sont des questions auxquelles est confronté l'historien en tant que producteur de savoir, qui, membre d'une communauté savante use d'une instrumentation afin de mettre en forme de manière réglée une matérialité.

Machine de Türing

De fait, je réduis l'historien à l'une simplement de ses dimensions. Le rapport entre cet avatar et un historien concret est analogue à celui qui unit les machines que nous avons sur notre bureau et les machines Türing. De même je réduis l'informatique réseau, partie d'un système industriel complexe et millefeuille de textes à l'une de ses dimensions qui correspond à peu près à celle du script et du code intelligible, parce que c'est ce qui me permet de mettre ces deux univers en rapport et de comprendre (rygiel 2011). L'historien en effet devi
ent alors un producteur de chaînes symboliques et et l'informatique réseau une machine à manipuler et transmettre les chaînes symboliques.

Défis historiens

La spécificité de la position historienne devient alors le fait que le volume de données disponibles sous forme numérique est certes en croissance, mais modeste au regard de que les géographes par exemple, ou les sociologues peuvent collecter et infime surtout au regard de la documentation jugée pertinente par la corporation, le fait aussi que la documentation historienne, généralement fragmentaire, lacunaire, inconnue souvent dans son principe de génération suppose des ajustements, parfois conséquents des outils nés en d'autres contextes.

Chantiers en cours

Je voudrais pour illustrer ces logiques revenir sur un certain nombre de projets en cours, et les regarder d'un peu près en m'attachant à des objets que j'ai choisi non pas forcément parce que je les pense parfaitement illustratifs ou exceptionnels, mais parce que je les connais bien pour avoir été, à divers titres, impliqués dans leur déroulement. (rygiel, lamassé, 2013)

Acquérir et numériser

Un exemple le projet Alpage, Du plan au Sig. http://www.esrifrance.fr/sig2008/univ_larochelle.htm

 

Flux vidéos et matrce  http://matricememory.fr/matrice/index.html Matrice

Documenter/Structurer

Entreposer numériquement le patrimoine documentaire des mondes populaires et du mouvement ouvrier

http://www.peoplesheritage.eu/fr/a_propos_de_hope.htm People's heritage

... et s'y retrouver Europeana

Fouiller et visualiser

  1. Défis de la description semi-automatique
  2. De la chaîne de caractère au sémantique
  3. La multiplication des traceurs : quelques exemples

La construction d'une instrumentation indigène

Le projet http://analyse.univ-paris1.fr/ Analyse

Txm et les not quite big datas

Disséminer

Segmentation des publics (Noiret 2011)

Multiplication des formes

;L'Histoire est elle texte ?

http://www.dailymotion.com/Histoire-sociale#video=xvbkta CHS Prod
 

Conclusions

Je voudrais d'abord revenir rapidement sur le contraste entre les choses très techniques dont nous venons de voir quelques aspects et la prolifération des abstractions qui servent à les introduire. Il me semble, et là en accord nous partons du point de vue du chercheur comme individu, voire comme étudiant que tenir, ce qui n'est pas simple, ces deux bouts de la chaîne, est à peu près la seule façon de cartographier dynamiquement notre environnement, et ses composantes numériques. Usage métaphorique de la carte qui ferait sans  doute soupirer Henri Debois que nous verrons demain, qui y verrait le signe d'une pensée carto-centrée, mais qui a ici l'avantage de pointer le fait que pour trouver des routes il faut une carte qui incorpore une visée (en un sens pour le coup souvent peu métaphorique), une théorie et une grosse pincée de mathématiques. Or les changements, parfois rapides du contexte de notre travail imposent en permanence des choix d'instrumentation dont les conséquences peuvent, pour l'individu, longtemps peser sur ses pratiques et sa situation. Que celui d'entre vous qui n'a jamais un peu nerveusement demandé à des collègues ou des collaborateurs censés être experts quelle machine, quel logiciel, quel langage semblait le plus approprié. Et ces choix, qui sont toujours des choix sous contrainte sont aussi conditionnés par divers facteurs dont je crois que nous verrons auourd'hui, à plusieurs reprises qu'ils supposent une compréhension et une connaissance de cet environnement numérique qui va au delà de la simple capacité à repérer les outils en vogue à tel ou tel moment et une agilité procédurale limitée à quelques outils à la pérennité douteuse.

  1. Stéphane Lamassé and Philippe Rygiel. Nouvelles frontières de l’historien.Revue Sciences/Lettres (2), 2013.
  2. Philippe Rygiel. L’enquête historique à l’ère numérique Revue d’histoire moderne et contemporaine 58(4bis) :30–40, 2011.
  3. L’histoire minuscule et anecdotique de spip.
  4. Serge Noiret. La digital history : histoire et mémoire à la portée de tous Ricerche storiche, XLI(1) :111–149, avril 2011.