Tecnología

Harvard democratiza la IA

Vistas: 73

Comparte el artículo:

La Universidad de Harvard ha dado un paso transformador en el mundo de la inteligencia artificial (IA) al anunciar la publicación de un conjunto de datos de casi un millón de libros de dominio público.

Dos años de ChatGPT
Nuevo sistema tecnológico para el control vial
Foto del avatar
Somos el medio de comunicación más leído de Punta del Este. La evolución digital de un medio impreso icónico del Este, que combina el rigor del periodismo tradicional con la inmediatez del mundo online.
Redes Sociales

Harvard democratiza la IA: una biblioteca de dominio público para entrenar modelos de lenguaje

La Universidad de Harvard ha dado un paso transformador en el mundo de la inteligencia artificial (IA) al anunciar la publicación de un conjunto de datos de casi un millón de libros de dominio público. Este recurso, financiado por Microsoft y OpenAI, tiene el potencial de revolucionar la industria de la IA al igualar las condiciones para desarrolladores, investigadores independientes y startups que antes carecían de acceso a materiales de entrenamiento de alta calidad.

Greg Leppert, director ejecutivo de la Iniciativa de Datos Institucionales (IDI) de Harvard, explica que el objetivo es democratizar el acceso a los datos necesarios para construir grandes modelos de lenguaje (LLM) y otras herramientas de IA. «Es un intento de nivelar el terreno de juego», señala Leppert. Este repositorio incluye obras que van desde los clásicos de Shakespeare y Dante hasta manuales de matemáticas checos y diccionarios galeses.

Un paso hacia la transparencia

Mientras los gigantes tecnológicos enfrentan demandas por el uso de datos protegidos por derechos de autor, esta iniciativa subraya la importancia de las fuentes de dominio público. Según Burton Davis, vicepresidente de Microsoft, «crear grupos de datos accesibles es fundamental para avanzar en la industria de forma equitativa». Microsoft y OpenAI han respaldado esta colaboración como parte de un compromiso más amplio con la innovación responsable.

A medida que estas iniciativas ganan tracción, el futuro de la IA podría depender en gran medida de cómo se gestionan los datos de entrenamiento. Si los tribunales dictaminan a favor de las empresas tecnológicas en litigios sobre derechos de autor, el acceso libre a repositorios como el de Harvard podría convertirse en un modelo sostenible. En caso contrario, la industria se enfrentará a una revisión profunda de sus prácticas.

El impacto global

El proyecto no está solo. Iniciativas similares, como la base de datos Common Corpus, desarrollada en Francia y respaldada por el Ministerio de Cultura, también están empujando los límites de lo que es posible con datos abiertos. Pierre-Carl Langlais, coordinador de Common Corpus, ha destacado que «este es un paso significativo hacia modelos de IA que cumplan con la legislación europea».

Más allá de los libros

La IDI también está colaborando con la Biblioteca Pública de Boston para digitalizar millones de artículos de periódicos de dominio público, sentando las bases para una nueva era de transparencia y colaboración en la IA. Este esfuerzo representa una declaración audaz: el acceso abierto a los datos no solo beneficia a las grandes empresas tecnológicas, sino también a la sociedad en su conjunto.

Con este movimiento, Harvard se posiciona en la vanguardia de un cambio cultural y tecnológico, estableciendo un ejemplo de cómo las instituciones académicas pueden liderar la democratización del conocimiento en la era digital.



Por:
tu negocio en

Los más leídos

Continúa leyendo en Esteña Press