HathiTrust Research Center (HTRC) permite el análisis computacional del corpus HathiTrust. Se trata de un centro de investigación puesto en marcha conjuntamente por la Universidad de Indiana y la Universidad de Illinois, junto con HathiTrust, para ayudar a superar los retos técnicos a los que se enfrentan los investigadores cuando tratan con grandes cantidades de texto digital.
HTRC crea herramientas y servicios para que se realicen investigaciones utilizando los datos de la Biblioteca Digital HathiTrust, abriendo nuevos caminos en los ámbitos de la minería de textos, permitiendo a los investigadores utilizar plenamente el contenido de HathiTrust.
La mayoría de estas herramientas están disponibles en el sitio web de HTRC Analytics:
- HTRC Worksets: Colección de documentos disponibles en HathiTrust creadas por el usuario.
- HTRC Extracted Features: conjunto de datos de libre acceso de metadatos y datos derivados del corpus de HathiTrust.
- HTRC Data Capsule: un entorno informático seguro para la realización de análisis de texto impulsados por los investigadores en el contenido de HathiTrust.
- HTRC Algorithms: conjunto de herramientas para reunir colecciones de texto digitalizado y realizar análisis de texto en ellas.