La prise de notes de la tablette de cire au support numérique

Christophe Pouzat, IRMA Univ. de Strasbourg & CNRS

La semaine de la Science Ouverte du Réseau des Urfist, 23 juin 2021

De quoi allons-nous parler ?

  • Nous utilisons tous des cahiers de notes
  • Un aperçu historique de la prise de notes
  • Du fichier texte au langage de balisage léger
  • Pérennité et évolutivité des notes avec la gestion de version
  • Les étiquettes et les logiciels d’indexation pour s’y retrouver

Nous utilisons tous des cahiers de notes

L’érudit qui annote son livre / manuscrit

Galilée qui observe les lunes de Jupiter

Les armoires à notes de Placcius et Leibniz

Les dangers de l’abondance de notes : la triste fin de Fulgence Tapir

Le Navigateur et son livre de bord : Éric Tabarly

Quel(s) support(s) matériel(s) pour les notes ?

Doit-on utiliser :

  • l’objet d’étude (comme pour le livre annoté) ;
  • un ou des cahiers ;
  • des fiches ou feuilles volantes stockées dans un classeur ;
  • un ou des fichiers d’ordinateur ;
  • des dessins ou photos ;
  • des films ;
  • … ?

Comment s’y retrouver ?

Les notes posent un problème d’organisation :

  • Comment peut-on imposer une structure à nos notes après coup ? Est-ce seulement possible ?
  • Peut-on les indexer, si oui, comment ?
  • Comment peut-on les rendre pérennes tout en les faisant évoluer ?

Un aperçu historique de la prise de notes

De quoi allons-nous discuter ?

  • de l’aspect concret de la prise de note – la « matérialité » des historiens – ;
  • de l’organisation des livres et des notes ;
  • du lien entre aspects matériels et organisationnels.

L’aspect matériel résumé sur une diapo

Tablette de cire et stylet

Du volumen au codex

Eusèbe et les références croisées

Canon eusébien

Importance du codex

D’après Frédéric Barbier dans l’« Histoire du livre » :

  • l’invention du codex est absolument fondamentale pour l’avenir de la civilisation écrite ;
  • le codex se prête à la consultation partielle ;
  • on peut lui superposer un système de références facilitant la consultation ;
  • on peut consulter le codex en prenant des notes ;
  • la combinaison du codex et de la minuscule donne un outil intellectuel très puissant, tel qu’il n’en existait pas antérieurement.

Parallèle chinois

Organiser en « mettant dans la bonne case »

Organiser avec une bonne « carte » : la méthode de John Locke

La méthode de John Locke (suite)

Conclusions

  • comme il est rarement possible de se passer complètement d’un support papier, apprendre de nos prédécesseurs devrait nous permettre de ne pas « réinventer la roue »  ;
  • clairement nous avons intérêt à utiliser autant que possible un support numérique pour profiter :
    • d’une plus grande flexibilité d’organisation, de réorganisation et de structuration ;
    • d’outils d’archivage fiables ;
    • d’outils d’indexation puissants.

Du fichier texte au langage de balisage léger

Fichier texte ?

  • de façon pratique, un « fichier texte » donne quelque chose de lisible lorsqu’il est ouvert avec un éditeur de texte ;
  • un « éditeur de texte » permet de créer et de modifier des fichiers textes (belle définition circulaire !) :
    • Notepad++ pour Windows ;
    • gedit pour les systèmes Unix / Linux (mais pas seulement) ;
    • TextEdit pour les MacOS.

Un fichier « non lisible » avec un éditeur de texte

Un fichier « texte » ouvert avec un éditeur de texte

Pourquoi utiliser des fichiers texte ?

Les caractères contenus dans le fichier texte sont codés en UTF-8 (Universal Character Set Transformation Format - 8 bits).

Cela implique que :

  • il est toujours possible de les lire avec un éditeur de texte même des années plus tard ;
  • les logiciels d’indexation ou de « recherche de bureau », comme les logiciels de gestion de versions, les exploitent pleinement.

Conclusion : choisissez le format texte (UTF-8).

Problème du fichier texte « simple »

  • avec un fichier texte « simple » il n’est pas possible de profiter des outils de navigation comme les hyperliens ;
  • de même, il n’est pas possible de mettre en évidence un mot ou un groupe de mots avec une police grasse ou une police italique ;
  • si plusieurs personnes travaillent sur un même texte, elles ne peuvent se corriger en barrant des mots.

Un fichier HTML visualisé avec un navigateur

Un fichier HTML visualisé avec un éditeur de texte

Le problème se résume ainsi :

  • les fichiers texte sont attractifs pour la prise de notes ;
  • les langages de balisages donnent un meilleur confort de lecture des fichiers avec logiciel « de rendu » ;
  • les langages de balisages utilisent (généralement) des fichiers source au format texte, mais nécessitent des éditeurs spécialisés.

Peut-on combiner la légèreté des fichiers textes « simples » avec le confort de lecture offert par les langages de balisage ?

Langage de balisage léger : l’idée

Un langage de balisage léger est :

  • un type de langage de balisage utilisant une syntaxe simple ;
  • conçu pour qu’un fichier en ce langage soit aisé à saisir avec un éditeur de texte simple ;
  • facile à lire non formaté, c’est-à-dire sans logiciel dédié comme un navigateur internet.

L’exemple de Markdown

Markdown source (en haut) et sortie HTML (en bas).

Markdown n’est pas le seul langage de balisage léger disponible

  • Le plus communément employé est Wikitexte de Wikipédia ;
  • AsciiDoc a de nombreux adeptes ;
  • ReStructuredText est très employé par la communauté des programmeurs Python ;
  • il y en a bien d’autres.

Conclusions

Les langages de balisage léger vont nous permettre de :

  • travailler avec des fichiers textes ;
  • écrire rapidement nos notes, avec n’importe quel éditeur, grâce à leur syntaxe simplifiée ;
  • organiser nos notes en les structurant.

Pérennité et évolutivité des notes avec la gestion de version

L’évolutivité avec un support papier

L’évolutivité avec traitement de texte

L’évolutivité avec un « moteur de wiki »

« Derniers changements »

Je clique sur le nom de l’une des pages

Avantages et inconvénients des moteurs de wikis

  • solution qui a fait ses preuves, en particulier dans un cadre collaboratif ;
  • format texte (avec DokuWiki) ;
  • ne permet de modifier qu’une seule page à la fois.

L’évolutivité avec la gestion de version

Si je clique sur le bouton History

Je clique sur le numéro 5a2951f

Plusieurs modifications

Avantages et inconvénients

  • solution sophistiquée (donc un peu plus difficile à maîtriser que les précédentes) ;
  • solution qui a fait ses preuves, en particulier dans un cadre collaboratif sur de grands projets (noyau Linux) ;
  • permet d’enregistrer des modifications sur plusieurs fichiers à la fois ;
  • une sauvegarde centralisée dont tous les membres du projet ont une copie intégrale.

Les étiquettes et les logiciels d’indexation pour s’y retrouver

Ainsi parlait Leibniz

« Il me semble que l’apparat savant contemporain est comparable à un grand magasin qui contient une grande quantité de produits, stockés de façon totalement désordonnée ; où l’indexation manque ; où les inventaires pouvant aider à ordonner le contenu ont disparu.

Plus grande est la quantité d’objets amassés, plus petite est leur utilité. Ainsi, ne devrions nous pas seulement essayer de rassembler de nouveaux objets de toutes provenances, mais nous devrions aussi essayer d’ordonner ceux que nous avons déjà. »

S’y retrouver dans un fichier texte

S’y retrouver dans un cahier

S’y retrouver dans des « fiches »

Problèmes, limitations, solutions ?

  • les techniques précédentes ne fonctionnent que pour un seul « document » — recherche avec l’éditeur de texte, index d’un cahier — ou pour un seul type de document ;
  • les outils informatiques nous permettent d’aller plus loin dans l’indexation des fichiers numériques ;
  • il est possible de rajouter des étiquettes / mots-clés à des fichiers textes comme à des fichiers jpg ou png ou des fichiers pdf grâce aux métadonnées qu’ils contiennent ;
  • les moteurs de recherche de bureau peuvent indexer les fichiers textes, mais aussi les métadonnées des autres fichiers.

Trouver un mot quelconque avec DocFetcher

Le problème de l’« abondance »

Ajouter des étiquettes ou mots clés dans un fichier texte (Markdown)

Trouver une étiquette avec un moteur de recherche de bureau (DocFetcher)

Les fichiers images contiennent des métadonnées

Les métadonnées peuvent être modifiées

Les moteurs de recherche de bureau peuvent lire les métadonnées

Conclusion

En combinant :

  • des étiquettes insérées dans nos fichiers textes, images, PDF, etc ;
  • avec un moteur de recherche de bureau ;

nous pouvons espérer éviter le « cauchemar de Leibniz ».

Pour aller plus loin

Remerciements

  • Raphaëlle Bats pour m’avoir invité à vous parler ;
  • mon employeur, le CNRS, qui me laisse « perdre mon temps » à travailler sur ce genre de sujets ;
  • Konrad Hinsen, Arnaud Legrand, Laurence Farhi, Marie-Hélène Comte : mes complices et critiques pour le CLOM ;
  • vous pour m’avoir écouté !