← 11d.im

l'impact de la disponibilité de la donnée sur ses métiers

24.02.2022

En ce moment, à Etalab, je regarde comment poursuivre les recommandations du rapport DINUM-INSEE publié en 2021. Ayant une formation initiale en mathématiques appliquées dont les statistiques mais n’ayant jamais vraiment exercé le métier de statisticien et ayant sauté dans le bandwagon de la data science en venant plutôt des humanités numériques et de l’analyse de graphe, j’ai l’impression d’analyser quelque chose qui aurait du m’arriver mais auquel j’ai échappé par effet de détours.

En faisant, le rapprochement entre informatisation et polarisation des revenus (@autor2003, @goos2007, @frey2017), j’étais un peu trop focus sur les effets des évolutions techniques comme l’arrivée du machine learning. Tout en gardant en tête qu’il y a d’autres causes externes dans la sélection de ce qui est automatisé ou informatisé. L’évolution technique s’est plutôt fait en défaveur des ouvriers de la logistique par exemple.

Le secteur a malgré tout connu des vagues de modernisation depuis vingt ans. Auparavant, les entrepôts étaient des lieux de travail plutôt vétustes. Les logiciels professionnels de gestion, qui servent à suivre les colis, à automatiser la gestion des stocks, sont arrivés en premier. Puis sont venues au milieu des années 2000 des technologies qui relient ces logiciels aux ouvriers : commandes vocales, casques sur les oreilles avec une voix numérique qui donne les consignes, écrans tactiles qui indiquent les emplacements, ou minuteurs indiquant le temps imparti pour chercher un produit.

Ces technologies entraînent plus de répétitivité dans les tâches qui nécessitent moins de savoir-faire et d’autonomie. Elles vont aussi accélérer et intensifier le travail. Par exemple, la commande vocale augmente de 10 % à 15 % la productivité dans les entrepôts.

Enfin, le travail devient individualisé – il n’y a plus de besoin d’échanger avec les collègues – et un contrôle de l’ouvrier s’est instauré, car ces technologies permettent un suivi précis de l’activité.

Entretien « Le travailleur de la logistique symbolise l’ouvrier moderne » (Alternatives Économiques)

Pour en revenir au travail de la donnée, je pense qu’un changement majeur qui correspond également au décollage des termes « data scientist » et « data analyst » dans les recherches google est la multiplication de disponibilité de données ouvertes ou sous forme de proto-data trust. Je me souviens par exemple qu’au début de ce qui aurait pu être une carrière dans la statistique, les données à traiter étaient à 100% issues d’enquêtes faîtes soit même, achetées à une entreprise de sondage ou bien demandées à un organisme publique. Il y a également aussi un potentiel de composition de jeux de données qu’il y avait pas vraiment auparavant. Les données étant « en silo », on faisait des croiser à l’intérieur du même jeu de données mais pas vraiment de croisement étendus en mélangeant des bases de données à des niveaux individuels (et non-agrégés). Au mieux, on posait des chiffres côte à côte sans aller vraiment plus loin.

Dans cette sous-estimation de l’impact de l’open data sur le développement de nouveaux métiers ou la transformation des métiers d’analyste et de statisticien, je pense qu’on sous-estime également l’importance de l’effet de réseau. Il y a une polarisation. D’un côté, l’administration publique formule beaucoup de travail autour de la mise en qualité et de la distribution sans se poser trop de question sur la réutilisabilité effective et les réutilisations. Sans vraiment réutiliser elle-même non plus. De l’autre côté, il y a beaucoup d’annonces dans le privé qui se focalisent, au mieux, sur l’analyse et l’exploitation sans évoquer les compétences en acquisition de données et de production de nouvelles données ouvertes.

Cependant, mon hypothèse est que le petit décalage de tendance entre « data scientist » et « data analyst » provient d’une prise de conscience de la connaissance et de l’information que peuvent apporter les données disponibles. Il ne s’agit pas seulement de faire des moteurs de recommandation ou de la reconnaissance d’image. Il y a un potentiel encore inexploité de transformation des modes d’action, que ce soit du business ou du politique, plus largement agir sur/dans le social, à travers une meilleure compréhension par la modélisation et la composition de données.