Press "Enter" to skip to content

Les jeunes travailleurs forment l’IA – New York Blog

Appen a refusé de commenter spécifiquement.

“Si nous soupçonnons qu’un utilisateur a violé les conditions d’utilisation, Toloka effectuera une vérification d’identité et demandera une photo d’identité ainsi qu’une photographie de l’utilisateur portant la pièce d’identité”, explique Geo Zikaev, responsable des opérations chez Toloka.

Poussé par la course mondiale à l’IA, le secteur mondial de la collecte et de l’étiquetage des données devrait atteindre plus de 17,1 milliards de dollars d’ici 2030, selon Grand View Research, une société d’études de marché et de conseil. Les plateformes de crowdsourcing comme Toloka, Appen, Clickworker, Teemwork.AI et OneForma connectent des millions de travailleurs à distance du Sud avec des entreprises technologiques basées dans la Silicon Valley. La plate-forme publie des microtâches de ses clients technologiques, notamment Amazon, Microsoft Azure, Salesforce, Google, Nvidia, Boeing et Adobe. De nombreuses plates-formes s’associent à la propre plate-forme de services de données de Microsoft, l’Universal Human Relevance System (UHRS).

Ces travailleurs se trouvent principalement en Afrique de l’Est, au Venezuela, au Pakistan, en Inde et aux Philippines, bien qu’il existe également des travailleurs dans les camps de réfugiés qui étiquetent, évaluent et génèrent des données. Les travailleurs sont payés pour chaque travail, avec des salaires allant d’un centime à quelques dollars, bien que le haut de gamme soit considéré comme une perle rare, disent les travailleurs. « La nature du travail ressemble souvent à de l’esclavage numérique, mais c’est une nécessité pour gagner sa vie », explique Hasan, qui travaille désormais également pour ClickWorker et Appen.

Il est parfois demandé aux travailleurs de télécharger des fichiers audio, des images et des vidéos, qui contribuent à l’ensemble de données utilisé pour entraîner l’IA. Les travailleurs ne savent pas précisément comment leurs soumissions seront traitées, mais elles peuvent être très personnelles : sur l’onglet Emplois des travailleurs de ClickWorker, une tâche dit : « Montrez-nous votre(vos) bébé(s) ! Aidez à enseigner l’IA en prenant 5 photos de votre bébé/enfant ! » Pour 2 € (2,15 $). Le message suivant : “Laissez vos enfants (âgés de 13 à 17 ans) participer à un projet de selfie amusant !”

Certaines fonctionnalités incluent la modération du contenu, qui aide l’IA à faire la distinction entre le contenu innocent et le contenu contenant de la violence, des discours de haine ou des images pour adultes. Hasan a partagé un enregistrement d’écran de la tâche disponible le jour où il a parlé à Wired. Une tâche UHRS vous demandait d’identifier « putain », « merde », « bite » et « salope » dans un corps de texte. Pour Toloca, on lui a montré des pages et des pages de corps partiellement nus, y compris des images sexuelles, des publicités de lingerie, une sculpture révélatrice et même des corps nus dans des peintures de style Renaissance. fonction? Pour aider l’algorithme à faire la distinction entre un torse obscène et un torse autorisé, expliquez adulte et doux.

Be First to Comment

Leave a Reply

Your email address will not be published. Required fields are marked *