Microsoft y el entrenamiento de la IA

Mustafá Sulaymán, el director de IA de Midrosoft declaró, recientemente, que todo el contenido que está en la web se puede copiar, recrear o reproducir porque es gratuito.

En una entrevista con NBC, Sulaymán manifestó su postura respecto a si las empresas de inteligencia artificial — como Microsoft — han robado propiedad intelectual. El cofundador de DeepMind y actual jefe de la división de IA de Redmond, sostiene que cualquier contenido que se encuentre en la web desde la década de los noventa está ahí para que lo utilicemos.

“Con respecto al contenido que ya está en la web abierta, el contrato social de ese contenido desde los años 90 ha sido que es de uso legítimo”, dijo Sulaymán. “Cualquiera puede copiarlo, recrearlo, reproducirlo. Ha sido ‘software libre’, ese ha sido el entendimiento”.

Reconoce que existe otra “área gris” que tiene que ver con contenido protegido de una web. “Hay una categoría separada en la que un sitio web, un editor o una organización de noticias ha dicho explícitamente ‘no me rastreen ni me raspen’ por ningún otro motivo que no sea indexarme”, mencionó. Según el directivo de Microsoft, esos temas deben resolverse en los tribunales.

Durante la entrevista, Mustafá Sulaymán confesó que hay empresas que han accedido a estos datos protegidos. “Hasta ahora, algunos han accedido a esta información, no conozco a quien no lo haya hecho, pero eso se va a litigar”, señaló.

¿Se debe compensar económicamente a los creadores de contenido?

Compañías como OpenAI, Google, Microsoft o Midjourney han entrenado sus modelos de lenguaje con conjuntos de datos protegidos por derechos de autor. Bajo la óptica de Mustafá Sulaymán, las empresas no están obligadas a pedir autorización o compensar a los creadores de contenido. El “contrato social” les ampara para copiar, recrear o reproducir los datos.

El jefe de IA en Microsoft añade que las leyes sobre propiedad intelectual tendrían que ser diferentes, puesto que la economía de la información está a punto de cambiar radicalmente.

En una de sus afirmaciones mas fuertes señala que, “Vamos a reducir el coste de producción del conocimiento a cero. Es muy difícil para la gente asimilarlo, pero en 15 o 20 años produciremos nuevo conocimiento científico y cultural a un coste marginal casi nulo. Será de código abierto y estará disponible para todos.”

Dada la importancia de este directivo, dentro de una de las empresas mas poderosas de tecnología, habrá que ver la reacción de los creadores de contenidos. Muchos de ellos, recordemos, realizan diversas demandas. Un ejemplo reciente es la demanda que interpuso la industria musical contra dos compañías por utilizar canciones protegidas por copyright. A esa se suma las demandas de Getty contra la IA de Stable Diffusion y la de George R.R. Martin contra ChatGPT, quien considera que la OpenAI llevó a cabo un robo sistemático a escala masiva.

Es clave conocer el pensamiento de los directivos de las diversas empresas tecnológicas, ya que nos permiten predecir posibles movimientos, y entender las razones de sus acciones.

Por Observador Urbano https://observadorurbano.com.ar/

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *