Indianos gravam com câmeras na cabeça cortar frutas, dobrar roupas e cozinhar para treinar robôs domésticos — veja como funciona e quanto pagam

PUBLICIDADE

Indianos gravam com câmeras na cabeça cortar frutas, dobrar roupas e cozinhar para treinar robôs domésticos — veja como funciona e quanto pagam

Trabalhadores em estúdios, fábricas e residências registram ações em primeira pessoa com smartphones, GoPros e sensores para alimentar modelos de IA que serão usados em robôs humanoides

Em Chennai e outros polos do sul da Índia, pessoas se acostumam a trabalhar com um smartphone ou uma câmera presa à cabeça enquanto realizam tarefas domésticas rotineiras — cortar mangas, dobrar toalhas, lavar louça ou preparar sanduíches. Os vídeos e os sinais de movimento coletados servem de base para treinar algoritmos que, no futuro, devem permitir que robôs façam essas atividades no mundo real.

Como as gravações são feitas

As filmagens são feitas em ambientes variados: estúdios mobiliados que simulam cômodos, linhas de produção têxtil e casas. Equipamentos usados incluem celulares montados na testa, câmeras do tipo GoPro e sensores de profundidade e de movimento presos aos pulsos, mãos e pernas. Cada clipe costuma durar cerca de quatro minutos; alguns colaboradores chegam a registrar dezenas de vídeos por dia e enviá-los por aplicativos especializados para empresas de dados.

As empresas que compram esses conjuntos de dados usam plataformas de aprendizado de máquina, como o Amazon SageMaker, para treinar modelos que traduzam movimentos humanos em comandos para robôs. A ideia é reduzir a lacuna entre simulações digitais e ações no mundo físico, alimentando modelos com gravações em primeira pessoa que mostrem exatamente como as mãos e o corpo se movem em tarefas cotidianas.

Quem participa e quanto recebem

Trabalhadores como Nagireddy Sriramyachandra, 25 anos, recebem cerca de 250 rúpias por hora — algo em torno de 2 dólares (aproximadamente 10,35 reais, segundo reportagem). Estudantes, donas de casa e funcionários de fábricas têm sido contratados por empresas como a Objectways e terceirizadas como a Qanat, que fornecem material para clientes, incluindo multinacionais da lista Fortune 500.

Alguns colaboradores também gravam áudio e participam de tarefas de coleta de fala para treinar modelos de reconhecimento e síntese vocal. Manish Agarwal, da Humyn Labs, afirma que essas gravações podem incluir discussões sobre temas variados para capturar padrões de fala.

Impactos no emprego e no mercado de robôs

O mercado de robôs humanoides tem projeções ambiciosas: estimativas como as do banco Morgan Stanley apontam para mais de um bilhão de robôs em uso até 2050. No curto prazo, a coleta de dados gera empregos e novas fontes de renda, mas especialistas alertam para riscos de precarização e para a possibilidade de expansão desses serviços.

Aditi Surie, do Indian Institute for Human Settlements, diz que é possível que as atividades de coleta de dados se ampliem. Enquanto isso, executivos do setor, como Ravi Shankar da Objectways, defendem que humanos e robôs trabalharão juntos no futuro — por exemplo, um soldador humano podendo controlar um robô à distância.

Apesar do otimismo, há sinais de desconforto: quem grava relata a sensação de estar sempre monitorado e descreve avisos técnicos quando os movimentos não são captados corretamente. A questão central segue sendo técnica e ética: criar máquinas que atuem com precisão em ambientes reais exige muitos dados humanos, mas também levanta dúvidas sobre condições de trabalho, privacidade e o impacto no mercado de trabalho local.

No fim, essas gravações em primeira pessoa são vistas pelos desenvolvedores como um passo necessário para reduzir a diferença entre o que modelos de IA aprendem em ambiente digital e o que serão capazes de executar diante dos objetos, superfícies e imprevisibilidades do cotidiano doméstico.

Mais recentes

PUBLICIDADE