Modelos de lenguaje pueden entrenarse con bases de datos éticas, demuestran científicos El Sur de Acapulco

Modelos de lenguaje pueden entrenarse con bases de datos éticas, demuestran científicos. Noticias en tiempo real 06 de Junio, 2025 10:25

 

Madrid, España, 6 de junio de 2025. Un grupo de científicos ha demostrado que es posible entrenar grandes modelos de lenguaje (LLM, por sus siglas en inglés) con una base de datos ética, que no perjudica a los titulares de los derechos de autor, con resultados de rendimiento comparables a los de los modelos más populares.

Los LLM que impulsan la inteligencia artificial generativa necesitan enormes cantidades de datos en su entrenamiento para tener un buen rendimiento, y por ello, empresas como Meta, Google y OpenAI han terminado acudiendo a internet e incluso a sus propios productos para obtenerlos.

Esta situación ha generado un debate sobre el uso de documento protegidos por derechos de autor para entrenar esos LLM, en el que unas voces abogan por compensar a quienes están en posesión de esos derechos y otras, por preservar la capacidad de los modelos para aprender de material protegido.

Compensar a los titulares de los derechos de autor costaría miles de millones de dólares, e incluso las denuncias por falta de compensaciones pueden suponer un daños financieros de también miles de millones de dólares, como recogen científicos de 14 instituciones en un reciente estudio, con el que exponen la alternativa de una base de datos ética.

En concreto, indican que han creado una base de datos de dominio público y licencia abierta de 8TB, que han denominado The Common Pile, que recoge datos de 30 fuentes, incluídos investigaciones, audios, libros, enciclopedias, material educativo, código de programación y transcripciones, entre otros.

Para demostrar que es posible entrenar LLM sin perjudicar a los autores y con resultados en línea con los modelos más populares, han entrenado con texto extraído de The Common Pile dos modelos de 7.000 millones de parámetros, de un billón y dos billones de tokens, respectivamente.

Aseguran que los dos modelos ofrecen “un rendimiento competitivo” con modelos como Llama 1 y Llama 2 de 7.000 millones de parámetros. “Nuestros resultados demuestran que The Common Pile no solo es el conjunto de datos más sólido para el preentrenamiento bajo una restricción de licencia abierta, sino que también produce modelos comparables a aquellos entrenados con una cantidad equivalente de datos sin licencia”, afirman en el texto de la investigación publicado en GitHub.

Consideran, además, que la base de datos “representa el primer paso en el camino hacia un ecosistema de modelo de lenguaje más ético, donde el rendimiento no tiene por qué llegar a costa de los derechos de los creadores y la transparencia legal”.

Texto: Portaltic/EP

El cargo Modelos de lenguaje pueden entrenarse con bases de datos éticas, demuestran científicos apareció primero en El Sur Acapulco suracapulco I Noticias Acapulco Guerrero.


Compartir en:
   

 

 

Icónica cadena de restaurantes anunció el cierre de todas sus sucursales tras 30 años en Texas y Arizona.22:20

Reconocida por su fusión de cocina mexicana y texana, anunció el cierre definitivo de su último local debido a dificultades económicas y el vencimiento del contrato de arrendamiento

Infobae

Erick fabrica sillas de ruedas gratis para perritos y gatitos con discapacidad. 22:20

Erik ha lanzado la iniciativa de donar sillas de ruedas gratis para perritos y gatitos con discapacidad.

El Imparcial

¿Para qué sirve un ventilador de refrigeración?.

¿Sabías que uno de los componentes más importantes para que tu maquinaria pesada funcione correctamente es el ventilador del motor? En este artículo te vamos a contar qué es un ventilador de enfriamiento, qué tipos existen y por qué es tan clave para que tu equipo no se sobrecaliente y trabaje a su máximo rendimiento.

Lado.mx

¡Impactante! Ingresos de la minería en la nube de Bow Miner revelados: XRP gana $20,000 al día, ETH gana $35,000 al día ¡y BTC es aún más sorprendente!.

Despídete de la minería tradicional y da la bienvenida a la nueva era de la riqueza inteligente. Imagina estar recostado en una silla de playa, bebiendo una bebida helada, mientras tus activos criptográficos generan ingresos para ti las 24 horas del día.

Lado.mx

Sentenciados a 50 años por secuestro agravado en Naolinco. 21:43

Redacción Hora Cero Xalapa, Ver., 4 de julio de 2025.-La Fiscalía General del Estado, a través de la Unidad Especializada en Combate al Secuestro, logró sentencia condenatoria de 90 años de prisión en contra de Miguel Ángel “N”,  Joaquín “N” y Pedro “N” como responsables del delito de secuestro agravado, cometido en agravio de

Hora Cero

¡Es oficial! Aarón Mercury se une a la tercer temporada de La Casa de los Famosos México . 12:21

El tiktoker y creador de contenido es el tercer habitante confirmado para la nueva temporada.

El Imparcial

Exhorta Congreso del Estado a municipios para que establezcan Centros de Bienestar Animal. 01:30

Staff/RG En sesión pública ordinaria se avalaron acuerdos en materia de vivienda, migración y educaciónThe post Exhorta Congreso del Estado a municipios para que establezcan Centros de Bienestar Animal appeared first on Desde Puebla.

Desde Puebla

Susana Zabaleta

El romántico detalle que Ricardo Pérez tuvo con Susana Zabaleta durante su show en vivo. 26 de Junio, 2025 13:51

M. AguirreDurante su más reciente presentación en el Teatro Metropólitan, el comediante Ricardo Pérez sorprendió al público al dedicar una canción en vivo a su pareja, la soprano Susana Zabaleta.El gesto ocurrió al final de su rutina y provocó una reacción inmediata entre los asistentes, quienes ovacionaron el momento. Sin discursos elabo

Excelsior

COMEDIANTE JESSICA SEGURA REVELA VERDAD SOBRE VISITA DE SUSANA ZABALETA AL CANAL LAS ENVINADAS. 03 de Julio, 2025 11:20

Comediante y actriz Jessica Segura revela su verdadera opinión sobre la visita de Susana Zabaleta al canal de YouTube 'Las Envinadas'En una charla con la prensa mexicana, Jessica Segura, comediante y actriz de la popular serie 'Una familia de diez', habló abiertamente sobre su experiencia con la actriz Susana Zabaleta, quien

El Diario de Sonora

Ninel Conde

Ex abogado de Ninel Conde asegura que la estrella paga con cuerpo sus deudas. 02 de Julio, 2025 17:04

Gustavo Herrera insinuó que la cantante Ninel Conde presuntamente acostumbra a pagar deudas con "cuerpo" y la amenazó con una demanda

Periódico Correo

La Casa de los Famosos México: revelan quién será el mejor pagado. 03 de Julio, 2025 10:13

La tercera temporada de La Casa de los Famosos México dará inicio el domingo 27 de julio de 2025 a las 20:30 horas, prometiendo una edición llena de emociones y momentos memorables para su audiencia. La producción ha decidido otorgar un salario destacado a una de las figuras más reconocidas del espectáculo nacional.La persona en cuestión rec

El Siglo de Torreón

¿Condicionó Ninel Conde no hablar uno de sus ex para entrar a La Casa de los Famosos?. 03 de Julio, 2025 10:13

Ninel Conde, quien será la participante mejor pagada en la tercera temporada de La Casa de los Famosos México, ha decidido no abordar en el reality su relación con Larry Ramos, su expareja prófugo de la justicia estadounidense. Esta determinación se debe a la compleja y dolorosa experiencia que vivió junto al empresario colombiano, acusado de

El Siglo de Torreón

Queen

Una de las escenas más esperadas del MCU fue arruinada por Reddit: así iban a presentar a Tobey y Andrew en Spider-Man: No Way Home . 01 de Julio, 2025 15:35

Spider-Man: No Way Home fue un parteaguas para los fanáticos del trepamuros. La película de 2021 ofreció por primera vez lo que muchos habían esperado durante años: ver reunidas a las tres versiones cinematográficas del personaje. Y aunque el metraje sufrió algunas filtraciones

Xataka México

Récord histórico, Dancing Queen de ABBA supera mil millones de vistas en YouTube. 01 de Julio, 2025 16:00

El éxito de la canción, impulsado por usuarios de países tan diversos como Brasil, Japón y Argentina, ilustra el impacto de la tecnología en la universalización de los grandes himnos musicales

Infobae

La reina del reggaetón enloqueció al público en la fiesta  Hispana de Philadelphia. 01 de Julio, 2025 16:36

Notisarz-Foto-Prensa  Miami, 1 julio (Notistarz).- La Reina del Reguetón  Ivy Queen, encendió el fin de semana el Love Park de Philadelphia durante La Fiesta Hispana Anual de Concilio, con un show brutal… La entrada La reina del reggaetón enloqueció al público en la fiesta  Hispana de Philadelphia se publicó primero

Notistarz

La información agregada y la responsabilidad de esta, pertenece a los sitios que lo publican. Lado.mx solo se encarga de publicarla.