**Crear la Herramienta de Limpieza de Transcripción**
Durante mi estadía en la beca de interés para la diversidad y la tecnología, Kathryn Turner, tuve la oportunidad de trabajar junto a mi mentor en la creación de un programa/software que limpiara aún más los datos de proyectos completados en el Centro de Transcripción del Smithsonian. Sin embargo, primero debía entender qué información estaba «limpiando». El Centro de Transcripción alberga varios proyectos y temas, incluyendo colecciones del Archivo Institucional Smithsonian, como libros de campo que contienen información como registros diarios, datos de investigación o cartas de principios del siglo XIX. Estos proyectos y libros de campo suelen ser manuscritos y necesitan ser transcritos para que su texto completo pueda ser incluido y consultado en otras plataformas, como el Centro de Búsqueda de Colecciones Smithsonian y la Biblioteca de Patrimonio Biológico (BHL).
La imagen muestra una página de **Lista de Especímenes** del **Biological Survey of the San Francisco Mountain Region**, 1889
Para evitar dejar fuera información valiosa, se me instruyó a transcribir todo lo que aparecía en la página, incluyendo las etiquetas. Las etiquetas son utilizadas para mostrar exactamente qué se ha escrito en la página durante el proceso de transcripción. Por ejemplo, una etiqueta podría ser utilizada cuando una frase está subrayada, insertada en el texto o para indicar una imagen o sello en la página. Ayudé a transcribir algunas páginas del proyecto **Freedman’s Bureau** con el fin de familiarizarme con estas etiquetas y entender su importancia para los libros de campo.
Después de un tiempo, las etiquetas pueden hacer que la transcripción sea más compleja y difíciles de leer. Esto llevó a la creación de una herramienta que limpiara aún más estos datos, permitiendo a los investigadores y usuarios acceder a la información de manera más eficiente.
La herramienta de limpieza de transcripción fue diseñada para mejorar la calidad de los datos existentes en el Centro de Transcripción del Smithsonian. A través de su uso, se espera que se puedan identificar errores o inconsistencias en las etiquetas y, a su vez, permitir una mejor comprensión y visualización de la información.
**Palabras clave relevantes:**
* Herramienta de limpieza de transcripción
* Centro de Transcripción del Smithsonian
* Archivo Institucional Smithsonian
* Libros de campo
* Etiquetas en transcripciones
Descubre más desde Hoy En Perspectiva
Suscríbete y recibe las últimas entradas en tu correo electrónico.