OpenAI y Google supuestamente han utilizado copias de vídeos de YouTube para entrenar sus modelos de IA

OpenAI y Google entrenaron sus modelos de IA con texto transcrito de vídeos de YouTube, lo que podría violar los derechos de autor de los creadores de contenido, según New York Times. El informe, que describe los esfuerzos de las empresas OpenAI, Google y Meta para maximizar la cantidad de datos que pueden alimentar a sus sistemas de IA, cita a varias personas con conocimiento de las prácticas de las empresas. Esto se produce pocos días después de que el director ejecutivo de YouTube, Neil Mohan, dijera en una entrevista con… Orígenes de Bloomberg El supuesto uso de vídeos de YouTube por parte de OpenAI para entrenar su nuevo generador de texto a vídeo, Sora, Irá en contra de las políticas de la plataforma..

De acuerdo con la Los New York TimesOpenAI utilizó la herramienta de reconocimiento de voz Whisper para transcribir más de un millón de horas de vídeos de YouTube, que luego se utilizó para entrenar GPT-4. la información Anteriormente informé que OpenAI utilizó videos y podcasts de YouTube para entrenar sus sistemas de inteligencia artificial. Según los informes, el director de OpenAI, Greg Brockman, estaba entre las personas de ese equipo. Matt Bryant, portavoz de Google, dijo que según las reglas de Google, no se permite «el recorte o la descarga no autorizada de contenido de YouTube». Los New York TimesTambién dijo que la empresa no tenía conocimiento de ningún uso de este tipo por parte de OpenAI.

Sin embargo, el informe afirma que había personas en Google que sabían pero no tomaron ninguna medida contra OpenAI porque Google estaba usando videos de YouTube para entrenar sus modelos de IA. Google dijo Los New York Times Sólo lo hace con vídeos de creadores de contenido que lo hayan aceptado. Engadget se ha puesto en contacto con Google y OpenAI para hacer comentarios.

READ  GoPro relanza la aplicación GoPro Quik

el Los New York Times El informe también afirma que Google pidió a un equipo que modificara su política de privacidad en junio de 2023 para cubrir el uso de contenido más amplio disponible públicamente, incluidos Google Docs y Google Sheets, para entrenar sus modelos y productos de inteligencia artificial. Los cambios, que según Google se hicieron para mayor claridad, se publicaron en julio. bryant dijo Los New York Times Este tipo de datos sólo se utiliza con el permiso de los usuarios que se han registrado para las pruebas de funciones beta de Google, y la empresa «no ha comenzado a capacitarse sobre tipos adicionales de datos basados ​​en este cambio de lenguaje». El cambio agregó a Bard como ejemplo de para qué se pueden usar estos datos.

Corrección, 6 de abril de 2024, 3:45 p.m. ET: Esta historia informó originalmente que Google actualizó su política de privacidad en junio de 2022. En realidad, la actualización de la política se realizó en 2023. Nos disculpamos por el error.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *