Menores de edad están entrenando a la inteligencia artificial

19/11/2023. WIRED – Las empresas que prestan servicios de etiquetado de datos de inteligencia artificial a las grandes tecnológicas están inadvertidamente contratando a jóvenes adolescentes que burlan los controles para trabajar en sus plataformas, exponiéndose a menudo a contenidos traumáticos.


Como la mayoría de los niños de su edad, Hassan, de 15 años, pasaba mucho tiempo en internet. Antes de la pandemia, le gustaba jugar al futbol con los niños de su pueblo natal, Burewala, en la región pakistaní de Punjab. Pero los encierros de Covid le convirtieron en una especie de recluso, pegado a su teléfono móvil. «Solo salía de mi habitación cuando tenía que comer algo», recuerda Hassan, quien ahora tiene 18 años y pidió que se le identificara con un seudónimo porque temía acciones legales. Pero, a diferencia de la mayoría de los adolescentes, no estaba haciendo scroll en TikTok ni jugando. Desde su habitación de la infancia, este estudiante de secundaria trabajaba en la cadena de suministro mundial de inteligencia artificial, cargando y etiquetando datos para entrenar algoritmos para algunas de las mayores empresas de IA del mundo.

¿Quién entrena a la inteligencia artificial?

Los datos brutos utilizados para entrenar algoritmos de aprendizaje automático son etiquetados primero por humanos, y también es necesaria la verificación humana para evaluar su precisión. Este etiquetado de datos va desde lo más sencillo, como identificar imágenes de semáforos, por ejemplo, o comparar productos de comercio electrónico similares, hasta lo más complejo, como la moderación de contenidos, en la que los trabajadores clasifican el contenido nocivo de los datos extraídos de todos los rincones de internet. Estas tareas suelen subcontratarse a trabajadores externos, a través de plataformas de crowdsourcing en línea, como Toloka, donde Hassan empezó su carrera.

Un amigo le puso en contacto con el sitio, que prometía trabajo en cualquier momento y desde cualquier lugar. Descubrió que por una hora de trabajo ganaba entre 1 y 2 dólares, más que el salario mínimo nacional, que entonces era de 0.26 dólares. Su madre es ama de casa y su padre mecánico. «Se puede decir que pertenezco a una familia pobre», dice. Cuando llegó la pandemia, necesitaba trabajar más que nunca. Confinado en su casa, conectado e inquieto, investigó un poco y descubrió que Toloka era solo la punta del iceberg.

«La IA se presenta como una caja mágica que puede hacerlo todo», comenta Saiph Savage, director del Civic AI Lab de la Universidad Northeastern. «La gente simplemente no sabe que hay trabajadores humanos entre bastidores«.

Al menos algunos de esos trabajadores humanos son niños. Las plataformas exigen que los trabajadores sean mayores de 18 años, pero Hassan simplemente introdujo los datos de un familiar y utilizó un método de pago correspondiente para eludir los controles, y no fue el único en hacerlo. WIRED habló con otros tres trabajadores de Pakistán y Kenia que dijeron que también se habían unido a plataformas siendo menores de edad, y encontró pruebas de que la práctica está muy extendida.

Seguridad que no es a prueba de niños

«Cuando todavía estaba en la escuela secundaria, muchos adolescentes hablaban de trabajos en línea y de cómo se unían utilizando la identificación de sus padres», expresa un trabajador que se unió a Appen a los 16 años en Kenia, quien pidió permanecer en el anonimato. Después de clase, él y sus amigos se conectaban para completar tareas de anotación hasta bien entrada la noche, a menudo durante ocho horas o más.

Appen declinó hacer comentarios atribuibles.

«Si sospechamos que un usuario ha infringido el Acuerdo de Usuario, Toloka realizará una comprobación de identidad y solicitará un documento de identidad con foto y una foto del usuario que tiene el documento», asegura Geo Dzhikaev, jefe de operaciones de Toloka.

Impulsado por la fiebre mundial por la IA, se espera que el sector mundial de etiquetado y recopilación de datos crezca hasta superar los 17,100 millones de dólares en 2030, según Grand View Research, una empresa de consultoría e investigación de mercado. Plataformas de crowdsourcing como Toloka, Appen, Clickworker, Teemwork.AI y OneForma conectan a millones de trabajadores remotos del sur del mundo con empresas tecnológicas de Silicon Valley. Las plataformas publican microtareas de sus clientes tecnológicos, entre los que se encuentran Amazon, Microsoft Azure, Salesforce, Google, Nvidia, Boeing y Adobe. Muchas plataformas también se asocian con la propia plataforma de servicios de datos de Microsoft, Universal Human Relevance System (UHRS).

Estos trabajadores operan principalmente en África Oriental, Venezuela, Pakistán, India y Filipinas, aunque también hay trabajadores en campos de refugiados que etiquetan, evalúan y generan datos. Cobran por tarea, con una remuneración que oscila entre un céntimo y unos pocos dólares, aunque el extremo superior se considera una joya rara, aclaran los trabajadores: «La naturaleza del trabajo a menudo se siente como servidumbre digital, pero es una necesidad para ganarse la vida», señala Hassan, que ahora también trabaja para Clickworker y Appen.

Contenido no apto para menores de edad

A veces se pide a los trabajadores que carguen audio, imágenes y videos, que contribuyen a los conjuntos de datos utilizados para entrenar la IA. Los trabajadores no suelen saber exactamente cómo se procesarán sus envíos, pero estos pueden ser bastante personales. En la pestaña de trabajos de Clickworker, una tarea dice: «¡Enséñanos a tu bebé/niño! Ayúdanos a enseñar a la IA haciendo 5 fotos de tu bebé/niño!» por 2 euros (2.15 dólares). La siguiente reza: «¡Deja que tu menor (de 13 a 17 años) participe en un interesante proyecto selfie!».

Algunas tareas implican la moderación de contenidos: ayudar a la IA a distinguir entre contenidos inocentes y los que contienen violencia, incitación al odio o imágenes para adultos. Hassan compartió grabaciones de pantalla de tareas disponibles el día que habló con WIRED. Una de las tareas de UHRS le pedía que identificara palabras obscenas en un texto. Para Toloka, se le mostraron páginas y páginas de cuerpos parcialmente desnudos, incluidas imágenes sexualizadas, anuncios de lencería, una escultura expuesta e incluso un cuerpo desnudo de una pintura renacentista. ¿La tarea? Descifrar lo adulto de lo benigno, para ayudar al algoritmo a distinguir entre torsos salaces y admisibles.

Hassan recuerda haber moderado contenidos cuando era menor de 18 años en UHRS que, confiesa, siguen pesando sobre su salud mental. Dice que el contenido era explícito: relatos de incidentes de violación, extraídos de artículos que citaban actas judiciales; discursos de odio extraídos de publicaciones en redes sociales; descripciones de asesinatos sacadas de artículos; imágenes sexualizadas de menores; imágenes de mujeres adultas desnudas; videos para adultos de mujeres y niñas de YouTube y TikTok.

“Fue fácil”

Muchos de los trabajadores a distancia en Pakistán son menores de edad, apunta Hassan. Hassan realizó una encuesta a 96 personas en un chat de grupo de Telegram con casi 10,000 trabajadores de UHRS, por encargo de WIRED. Alrededor de una quinta parte dijo tener menos de 18 años.

Awais, de 20 años, de Lahore, que habló con la condición de que no se publicara su nombre de pila, empezó a trabajar para UHRS a través de Clickworker a los 16 años, después de prometer a su novia un viaje de cumpleaños a los lagos turquesa y las montañas nevadas de la región septentrional de Pakistán. Sus padres no podían ayudarle con el dinero, así que recurrió al trabajo de datos, incorporándose con el carné de identidad de un amigo: «Fue fácil», destaca.

Trabajaba a diario en el sitio, sobre todo realizando la tarea «Generic Scenario Testing Extension» de Microsoft. Se trataba de comprobar la exactitud de la página de inicio y del motor de búsqueda. En otras palabras, ¿seleccionar «ofertas de autos» en la página de inicio de MSN mostraba fotos de autos? ¿Al buscar «gato» en Bing aparecían imágenes de felinos? Ganaba entre 1 y 3 dólares al día, pero el trabajo le resultaba monótono y exasperante. A veces tenía que trabajar 10 horas por 1 dólar, porque para acceder a determinadas tareas tenía que recibir formación no remunerada. Incluso cuando superaba la formación, podía no haber ninguna tarea que completar; o si sobrepasaba el límite de tiempo, le suspendían la cuenta, indica. Luego, de la nada, le prohibieron realizar su tarea más lucrativa, algo que, según los trabajadores, ocurre con regularidad. Las prohibiciones pueden producirse por una serie de razones, como dar respuestas incorrectas, responder demasiado rápido o dar respuestas que se desvían del patrón medio de otros trabajadores. Había ganado 70 dólares en total. Era casi suficiente para llevar de viaje a su novia del instituto, así que Awais se desconectó para siempre.

Clickworker no respondió a las solicitudes de comentarios. Microsoft declinó hacer comentarios.

«En algunos casos, una vez que el usuario termina la formación, ya se ha alcanzado el cupo de respuestas para ese proyecto y la tarea ya no está disponible», explicó Dzhikaev. «Sin embargo, si hay otras tareas similares disponibles, podrán participar sin más formación».

La cuota latinoamericana

Los investigadores dicen haber encontrado pruebas de trabajadores menores de edad en la industria de la IA en otras partes del mundo. Julián Posada, profesor adjunto de Estudios Americanos en la Universidad de Yale, quien estudia el trabajo humano y la producción de datos en la industria de la IA, refiere que ha conocido a trabajadores en Venezuela que se unieron a plataformas siendo menores de edad.

Las distancias físicas entre los trabajadores que forman a la IA y las gigantes tecnológicas del otro extremo de la cadena de suministro («la desterritorialización de internet», la llama Posada) crean una situación en la que fuerzas de trabajo enteras son esencialmente invisibles, regidas por un conjunto diferente de normas, o por ninguna.

Trabajando en serie para la máquina

La falta de supervisión de los trabajadores puede incluso impedir que los clientes sepan si los trabajadores mantienen sus ingresos. Un usuario de Clickworker en India, que pidió el anonimato para evitar ser expulsado del sitio, dijo a WIRED que «emplea» a 17 trabajadores de UHRS en una oficina, proporcionándoles computadora, teléfono e internet, a cambio de la mitad de sus ingresos. Aunque sus trabajadores tienen entre 18 y 20 años, debido a la falta de requisitos de certificación de edad de Clickworker, sabe de adolescentes que utilizan la plataforma.

En los rincones más oscuros de la industria del crowdsourcing, el uso de trabajadores infantiles es manifiesto.

Los servicios de resolución de captchas (Completely Automated Public Turing test to tell Computers and Humans Apart), en los que las plataformas de crowdsourcing pagan a humanos para que resuelvan captchas, son una parte menos conocida del ecosistema de la IA. Los captchas están diseñados para distinguir a un robot de un humano. El ejemplo más notable es el reCaptcha de Google, que pide a los usuarios que identifiquen objetos en imágenes para entrar en un sitio web. El propósito exacto de los servicios que pagan a personas para resolverlos sigue siendo un misterio para los académicos, sostiene Posada. «Pero lo que puedo confirmar es que muchas empresas, incluida reCaptcha de Google, utilizan estos servicios para entrenar modelos de IA», afirma. «Por lo tanto, estos trabajadores contribuyen indirectamente a los avances de la IA».

Google no respondió a una solicitud de comentarios a tiempo para su publicación.

Hay al menos 152 servicios activos, la mayoría con sede en China, con más de medio millón de personas trabajando en el mercado clandestino de reCaptcha, según un estudio de 2019 realizado por investigadores de la Universidad de Zhejiang en Hangzhou.

«Trabajo estable para todos. En todas partes», promete un servicio, Kolotibablo, en su página web. La empresa tiene un sitio web promocional dedicado a mostrar los testimonios de sus trabajadores, que incluye imágenes de niños pequeños de todo el mundo. En una, un sonriente niño indonesio muestra a la cámara su pastel de cumpleaños número 11. «Estoy muy contento de poder aumentar mis ahorros para el futuro», escribe otro, de no más de 7 u 8 años. Una niña de 14 años con un vestido largo de Hello Kitty comparte una foto de su puesto de trabajo: una laptop sobre un escritorio rosa con temática de Barbie.

No todos los trabajadores entrevistados por WIRED se sienten frustrados con las plataformas. A los 17 años, la mayoría de los amigos de Younis Hamdeen trabajaban de meseros. Pero el adolescente pakistaní optó por unirse a UHRS a través de Appen, utilizando la plataforma durante tres o cuatro horas al día, junto con el instituto, y ganando hasta 100 dólares al mes. Me encanta trabajar para esta plataforma», exclama Hamdeen, que ahora tiene 18 años, porque le pagan en dólares estadounidenses, algo poco habitual en Pakistán, y así se beneficia con tasas de cambio favorables.

Esclavitud digital infantil

Pero el hecho de que la remuneración por este trabajo sea increíblemente baja en comparación con los salarios de los empleados internos de las empresas tecnológicas, y que los beneficios del trabajo fluyan en una sola dirección -del Sur global al Norte global-, da lugar a paralelismos incómodos: «Tenemos que considerar el tipo de colonialismo que se está promoviendo con este tipo de trabajo», afirma Savage, del Civic AI Lab.

Hassan fue aceptado recientemente en un programa de licenciatura en tecnología de laboratorio médico. Las aplicaciones siguen siendo su único ingreso, trabajando en un turno de 8 de la mañana a 6 de la tarde, seguido por otro de 2 de la mañana a 6 de la mañana. Sin embargo, sus ingresos han caído a solo 100 dólares al mes, ya que la demanda de tareas ha superado a la oferta, al haberse incorporado más trabajadores desde la pandemia.

Se lamenta de que las tareas del UHRS pueden llegar a pagar tan solo 1 céntimo de dólar. Incluso en los trabajos mejor pagados, como las tareas ocasionales en redes sociales en Appen, la cantidad de tiempo que tiene que dedicar a la investigación no remunerada significa que necesita trabajar cinco o seis horas para completar una hora de trabajo en tiempo real, todo para ganar 2 dólares, comunica.

«Es esclavitud digital», sentencia Hassan.

¡Suscríbete a nuestro boletín!

Noticias relacionadas