Campus

Harvard digitaliza casi un millón de libros para entrenar a la IA

Harvard digitaliza libros para entrenar a la IA, un paso más hacia la era tecnológica. Probablemente ya conoces la inteligencia artificial, en particular algunas aplicaciones como Chat GPT, Deep Seek o Copilot, estos programas están diseñados para cumplir las órdenes de quien las usa. 

Cada una de sus respuestas busca ayudarte en las tareas que deseas agilizar. Sin embargo, la IA necesita de conocimiento, para ello, los desarrolladores de la inteligencia artificial han comenzado a recurrir a la fuente más grande de información: los libros. 

Harvard. Foto: Harvard.edu

Harvard digitaliza libros para entrenar a la IA

La Universidad de Harvard compartió grandes colecciones de textos en más de 256 idiomas a investigadores y empresas tecnológicas como Open AI, creador de Chat GPT. A este proyecto también se unió la Biblioteca de Boston. 

Lee también: ¿Cuántos estudiantes latinos tiene Harvard?

Como parte de la  Iniciativa de Datos Institucionales (IDI), la prestigiosa universidad subió más de un millón de textos de época que van desde el  siglo XV hasta el XIX. Esta propuesta busca digitalizar millones de páginas de libros para enseñarle a la IA lo que todavía desconoce de la humanidad.  

De acuerdo con Microsoft, se apuesta por el uso de textos en varios idiomas para garantizar que diversas comunidades puedan verse reflejadas en la variedad de datos y se espera beneficiar a muchas personas en este proceso, pues la información es para todos. 

Este trabajo tiene el apoyo económico de empresas de tecnología gigantes como Microsoft y Opena AI. Ambas instituciones buscan trabajar con información pública que resguardan las bibliotecas, así como contenido ético, cultural y pedagógico. 

Lee también: ¡Teclado en zapoteco llega a Android!, un paso hacia la inclusión

La IA y sus retos

Este modo de entrenar a la inteligencia artificial representa una forma ética de brindar conocimiento. No podemos olvidar que, a partir del año 2024, Meta anunció que comenzaría a utilizar datos de sus usuarios para entrenar a su IA, lo que generó una gran molestia en la comunidad. 

Además, la iniciativa busca mejorar la precisión de las respuestas con el uso de los textos que están a disposición de las IA ‘s y así evitar controversias debido al nulo conocimiento sobre ciertos temas. Esto marcará una gran diferencia frente a plataformas como Wikipedia u otras que no cuenten con este tipo de acervo. 

Por último, la Biblioteca de Boston anunció que cualquier material que sea digitalizado deberá ser de acceso público. Se prevé que se suban periódicos en francés de la Nueva Inglaterra del siglo XIX, los documentos y los de Harvard servirán para entrenar a la IA.

Autora: Paola Monge.

Comentarios
Staff Generación Universitaria

Pool de redactores especializados en los diferentes temas que trata el sitio Generación Universitaria, encargados de generar contenido diverso, actualizado y de interés para nuestras audiencias.

Entradas recientes

Kitty Fest Kawaii con útiles escolares de Hello Kitty: días y sede

Prepárate para el regreso a clases 2025 con estos útiles escolares con temática de Hello…

9 horas hace

¿Cómo tener acceso a la alberca olímpica de la UNAM?

"¡Al agua, patos!" Este es el paso a paso para solicitar acceso a la alberca…

10 horas hace

Certamen Estatal Juvenil de Literatura con premio de 100 mil pesos

Comienza a escribir y participa en el Certamen Estatal Juvenil de Literatura. ¡El ganador publicará…

13 horas hace

Mar Méndez, siete licenciaturas y un sueño: llegar al espacio

¡Desde Ingeniería hasta Gastronomía! En entrevista, Mar Méndez nos comparte cómo logra estudiar siete carreras…

1 día hace

Mindfulness digital: cómo cultivar presencia consciente en la universidad

Atención plena no implica renunciar a la tecnología, sino relacionarse con ella desde la consciencia.…

1 día hace

UAEMéx: estas son las rutas actualizadas del Potrobús 2025

¡Nuevas rutas, mismo Potrobús! La UAEMéx inicia el semestre con cambios en su servicio de…

1 día hace