Abstract
Les techniques d’apprentissage automatique traitent algorithmiquement des données fournies en entrée. Celles-ci font, au préalable, l’objet d’un travail d’annotation manuelle visant à en identifier les éléments saillants à des fins d’entraînement des modèles. Fastidieux et souvent déconsidéré, ce travail du clic façonne pourtant une « vérité » de référence pour l’IA, qui conditionne en grande partie les résultats produits. Cet article étudie les modalités d’exécution de ce travail et ses effets à partir de l’étude du cas de la conception d’un outil d’anonymisation automatique des décisions de justice au sein de la Cour de cassation. Enquête ethnographique et par entretiens permettent de mettre en évidence la pluralité des compétences mobilisées par les acteurs chargés de l’annotation des données. L’article montre l’importance des systèmes représentationnels et moraux dans la mise en œuvre de cette activité, et donc, pour le fonctionnement de l’IA.
Subject
Electrical and Electronic Engineering,Communication
Reference41 articles.
1. Réseaux ALAUZEN M. (2019), L’État Plateforme et l’Identification Numérique des Usagers. Le processus de conception de FranceConnect, vol. 1, n° 213, p. 211-239.
2. Machines à prédire;Benbouzid Bilel;Réseaux,2018
3. Florida Law Review BOYD D. (2016), Undoing the Neutrality of Big Data, n° 67, p. 226-232.
4. Proceedings of Machine Learning Research BUOLAMWINI J., GEBRU T. (2018), Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification, n° 81, p. 1-15.
5. How the machine ‘thinks’: Understanding opacity in machine learning algorithms;Burrell Jenna;Big Data & Society,2016