Tecnología

La inteligencia artificial enfrenta obstáculos para olvidar datos sensibles

Un estudio realizado por la Universitat Rovira i Virgili (URV) reveló que los modelos de lenguaje extensos como ChatGPT, Mixtral, Bard y Copilot presentan serias limitaciones para eliminar datos personales, incorrectos o discriminatorios una vez que han sido incorporados durante el entrenamiento.

🔍 Principales hallazgos del estudio

  • No existe una solución garantizada para borrar completamente datos sensibles sin reentrenar el modelo desde cero.
  • El proceso de «desaprendizaje» es complejo y costoso, especialmente en sistemas alimentados por grandes volúmenes de información.
  • Las técnicas actuales para eliminar fragmentos específicos de conocimiento no ofrecen garantías plenas y pueden afectar el rendimiento del modelo.
  • Esta situación entra en conflicto con el derecho al olvido establecido por el Reglamento General de Protección de Datos de la Unión Europea.

🛠️ Propuestas de mejora

  • Rediseñar los modelos desde su origen para permitir la fragmentación modular de datos, facilitando su eliminación sin comprometer el sistema completo.
  • Desarrollar nuevas estrategias de entrenamiento que contemplen el desaprendizaje como parte integral del diseño.

 

Publicaciones relacionadas

Botón volver arriba