Proyecto

datos.udp.cl es una plataforma de servicios web que te permite realizar búsquedas en un corpus de cerca de 1,5 mil millones de palabras (tokens) extraídas de los archivos históricos del periódico ‘La Nación’.

Este corpus se creó mediante la digitalización de los ejemplares de ‘La Nación’ y es de naturaleza diacrónica, es decir, está organizado cronológicamente desde 1917 hasta 1973. La plataforma datos.udp.cl te permite llevar a cabo búsquedas y comparaciones de palabras individuales (unigramas) y de pares de palabras (bigramas), tríos (trigramas), cuartetos (tetragramas) y quintetos (pentagramas) de palabras con el objetivo de analizar la evolución de términos, incluyendo sus primeras apariciones, tendencias y contrastes en su uso. Esto se aplica tanto a palabras que forman parte de diccionarios, como por ejemplo “democracia”, como a términos que se encuentran en enciclopedias, que a menudo son nombres propios.

Mediante la plataforma datos.udp.cl, la Universidad Diego Portales ofrece acceso público, abierto y gratuito a los archivos del periódico ‘La Nación’. Datos.udp.cl es el resultado del proyecto de investigación denominado “Fondo Enlace UDP: Listas de Frecuencias del Corpus La Nación (1917-1959)”. Para el año 2024, tenemos previsto ampliar el corpus para incluir el período de 1974 a 1989 del archivo histórico del periódico ‘La Nación.”