A fines de diciembre de 2024, la Facultad de Derecho de Harvard lanzó la Institutional Data Initiative (IDI), con el objetivo de construir una vasta colección de datos que permitan afirmar el papel de las entidades educativas como administradores del conocimiento en la era de la Inteligencia Artificial (IA).
El proyecto comenzó con la recopilación de datos de cerca de un millón de libros de dominio público y parte de Google Books.
Los autores de la IDI informaron que, luego de completar la estructuración y análisis del corpus, con el apoyo de Google, los libros estarán a disposición del público en línea.
En un contexto donde las compañías privadas dominan el desarrollo de la IA, la IDI tiene un concepto diferente. Para sus creadores, la IA construida en base a datos públicos debe ser un bien público.
Harvard y Google ofrecen cursos gratis. Foto: Pexels
Acceso gratuito: más de un millón de libros en línea gracias a Harvard y Google
Desde la página oficial de la IDI, afirman que “los avances en IA generan un inmenso interés en los datos de alta calidad que solo se encuentran en los archivos. Este nuevo interés puede ayudar a las instituciones a poner esos datos a disposición de todos”.
Agregan que “la IDI se dedica a apoyar a nuestros colegas en su tarea de administrar el conocimiento y buscar brindar el acceso más amplio a él en la era de la IA, tal como lo han hecho con tantos medios a lo largo de los siglos y a lo largo de las revoluciones tecnológicas que los han acompañado”.
Científicos de datos y creadores de comunidades trabajan en la IDI que nació en el Laboratorio de Innovación de Bibliotecas de Harvard. Afirman que colaboran con otras instituciones, como bibliotecas, universidades, grupos culturales y agencias gubernamentales, para analizar y publicar sus colecciones.
La Universidad de Harvard y Google se unen para dar cursos gratuitos. Foto: Pexels
En concreto, explican, “nuestras actividades iniciales incluyen refinar una colección de casi un millón de libros de dominio público y una colaboración con la Biblioteca Pública de Boston para poner a disposición millones de páginas de periódicos difíciles de encontrar”.
Explican que “las instituciones administran vastas y únicas colecciones de conocimiento, pero gran parte de ellas aún esperan que se haga accesible. Con las capacidades emergentes de la IA, creemos que se puede lograr un progreso significativo en hacer que esta información sea accesible, incluso para el acceso tradicional de los usuarios”.
Este tipo de trabajo colaborativo es una oportunidad para que las “comunidades de conocimiento” aprovechen al máximo su profunda experiencia en áreas a las que la comunidad de IA a veces recién llega. Para la comunidad de IA, incluidos aquellos que trabajan en modelos de código abierto, aumentar el acceso a estas colecciones tiene enormes beneficios.
La IDI cuenta con el apoyo de Microsoft y OpenAI y espera reunir a más patrocinadores. En tanto, habrá que esperar algún tiempo hasta que el millón de libros esté disponible en internet.
Mirá también
Mirá también
Cómo razona la inteligencia artificial
Mirá también
Mirá también
Cómo crear un asistente personal gratuito con Google, paso a paso
Mirá también
Mirá también
La nueva era de los asistentes virtuales, potenciada por la IA: cómo serán las próximas versiones Siri, Alexa+ y Google Gemini
Newsletter Clarín
Recibí en tu email todas las noticias, coberturas, historias y análisis de la mano de nuestros periodistas especializados
QUIERO RECIBIRLO
Tags relacionados