Un Workset de HTRC es una colección de documentos disponibles en HathiTrust creada por el usuario. HTRC ofrece las herramientas necesarias para el tratamiento de estos conjuntos de datos mediante las herramientas y los servicios.
Los Workset son creados por investigadores y se pueden compartir y citar para mejorar su difusión y uso por terceros.
Es necesario estar validado en HT para crear un nuevo workset o consultar aquellos que han sido creados previamente.
Se puede crear un Workset de tres formas:
Los worksets deben comenzar como una lista de identificadores numéricos de ejemplar en HathiTrust (por ejemplo, ucm.5325855911). Si se carga un listado de volúmenes para crear un workset, el archivo debe estar en CSV (valores separados por comas) o formato TXT. Puede contener otras columnas, pero solo se requiere la información relativa al ID del ejemplar en la primera columna, que tiene que tener el título "volume" o "id"..
Ejecute uno de los algoritmos de análisis de texto disponibles en HTRC para su workset También puede utilizar los ID de ejemplar de HathiTrust para descargar funciones extraídas de HTRC o descargar los ejemplares que componen su Workset en el entorno de la cápsula de datos de HTRC mediante la API de datos de HTRC.
Puede seleccionar ejemplares para analizar ser analizados mediante Workset Builder o puede cargar su propio Workset.
Workset Builder: Acceda a la interfaz HTRC para seleccionar volúmenes de dominio público y usar algoritmos predefinidos para llevar a cabo un análisis rápido de un Workset creado por usted.