← 11d.im

cuisiner la donnée

13.12.2022

Une idée que je travaille et que je mets en pratique, depuis quelque temps, est le travail des données est un travail de cuisine. Je n'ai pas encore les idées bien claires sur la question, et encore moins à force de retourner les mots dans ma tête. Ce texte est plus une proposition qu'une véritable introduction.

Pour parler des données, on empreinte souvent une métaphore énergétique : "data is the new oil" et dans le meilleur des cas une énergie renouvelable. Je n'ai plus les références, mais il y a aussi eu un moment à base de métaphores agricoles. Chez data.gouv.fr, on a par exemple, des moissonneurs de catalogue dans la prolongation du langage technocratique et européen sur ces questions. On parle aussi souvent d'ETL pour Extract, Transform, et Load. L'idée est dans la même lignée que la métaphore pétrolière. Il y a une source, un tuyau, des traitements puis enfin un stockage sous une forme transformée. Dans le métier, on dit également souvent le mot "pipeline".

C'est frustrant, car cela éclipse la part humaine et collective des données.

Christian Quest parle souvent de datatouille pour évoquer à la fois le film de Pixar, mais aussi le côté tambouille. Je pense qu'il est possible de prendre l'idée encore au sérieux et d'en faire un mode opératoire.

Dans la pratique, penser le travail des données comme une cuisine a plusieurs implications.

Concrètement, je regroupe mes fichiers en trois groupes correspondant aux grandes phases de préparation d'un service de restaurant :

  1. la préparation et des fichiers prep_*.(ipynb,py,qmd) où je prends des ingrédients que je goûte et que je mets en forme pour gagner du temps plus tard. C'est le temps de la découpe et du nettoyage. C'est aussi le moment de mettre en boîte pour que cela soit prêt à l'usage.

  2. la cuisine, l'assemblage, la cuisson, et des fichiers cook_*.(ipynb,py,qmd). Généralement, c'est le moment où on mélange les ingrédients préparés et où on les transforme en quelque chose d'autre par effet de combinaison. On dit habituellement faire des croisements. Faire dépasser la somme des parties.

  3. le service et des fichiers serve_*.(ipynb,py,qmd). C'est le moment où je pense à l'autre, à la personne qui va consommer le produit de mon travail. Il y a des questions de présentation, de saveurs, d'innovation, mais aussi de précision. Une soupe ou une bouillie n'est pas obligatoirement monotone. Des fois, c'est de la cuisine en batch pour une autre fois. On inclut les données dans un texte ou une présentation orale à faire, on arrive avec un plat.

Parfois tout cela a lieu dans un seul fichier, mais la structure reste linéairement la même.

Penser et faire de la donnée dans ce contexte est, pour moi, une manière d'amener plus de sensibilité et de détechniciser mon travail fait de chiffre et de code, mais également avec beaucoup d'humanité et de quotidien. Faire des tuyaux avec son cœur sonne moins bien que cuisiner des données avec son cœur. Je sais ce qu'apportent mes gestes, mon attention et mon soin. J'ai l'impression de travailler seul et avec d'autres pour une certaine forme de moment qui peut être aussi alimentaire que convivial, l'obligation a une forme d'hospitalité. Nourrir les esprits avec la force de l'intention et non pas se contenter de remplir les estomacs.

Avoir une connaissance, une affinité et une maitrise de mes ustensiles est également une nécessité. La limite est de pouvoir faire au mieux et non pas de fétichiser une chose plutôt qu'une autre. Leur matérialité renferme une culture qui se manifeste sensiblement. Les différentes bibliothèques, méthodes, et équations ont un goût et viennent avec un contexte.

Dans l'air du temps, la cuisine plutôt que la plateforme pétrolière. Une analogie plutôt qu'une métaphore.

C'est une vision que je trouve pleine de potentialité. J'ai aussi commencé un modeste site pour ouvrir ma cuisine, laisser voir ce qui j'y fais autant qu'en goûter les produits. J'ai dans l'espoir que ce premier texte en appellera d'autres.