Publicado originalmente el 13 de noviembre de 2019
Los conjuntos de datos de Brightspace vienen en dos tipos de extracción diferentes: diferencial y completo. Si es la primera vez que trabaja con conjuntos de datos de Brightspace, es posible que esté confundido acerca de qué tipo de conjunto de datos debe trabajar, o incluso cuáles son los diferentes casos de uso para cada tipo. En este post pretendemos aclarar algunos conceptos erróneos y preguntas frecuentes sobre el trabajo con estos diferentes tipos de extracción.
¿En qué se parecen los conjuntos de datos completos y diferenciales?
- Ambos tipos de conjuntos de datos tienen el mismo esquema de datos y se generan según una programación.
- Ambos están disponibles para su descarga como archivos csv comprimidos.
- Todos los campos de datos (columnas) y archivos con nombre (por ejemplo, inicios de sesión de usuario) que están disponibles en un tipo de extracción también están disponibles en el otro.
- Ambos siguen la misma política de gestión de cambios y el mismo cronograma encontrados aquí.
¿En qué se diferencian los conjuntos de datos completos y diferenciales?
Conjuntos de datos completos
- "Instantáneas" de los datos en el momento en que se genera el conjunto de datos completo
- Destinado a reemplazar un archivo de conjunto de datos completo anterior; No se utiliza junto con los completos anteriores
- Se genera semanalmente de forma predeterminada, diariamente con actualización paga
- Restringido a 150 millones de filas de los datos más recientes
Conjuntos de datos diferenciales
- 'Registro de cambios' en los datos desde que se generó el fichero diferencial anterior
- Diseñado para agregarse (mediante la inserción o actualización) de un almacén de datos que contiene datos extraídos previamente
- Se genera diariamente de forma predeterminada, por hora con actualización paga
- Dado el período de tiempo limitado dentro del cual se extraen los diferenciales, nunca debe alcanzar una limitación de recuento de filas
Todos los archivos son datos de cadena, pero la Guía de análisis de administración principal dice que se supone que deben ser diferentes tipos de datos, ¿tengo los archivos correctos?
¡Sí, lo haces! Le proporcionamos los datos en formato de cadena/texto para que puedan utilizarse con casi cualquier herramienta o sistema. Deberá convertir los datos de los campos de cadena al formato de datos correcto antes de usarlos.
Si solo necesito informar semanalmente o con menos frecuencia, ¿hay alguna razón para usar archivos diferenciales?
Por lo general, no: si no necesita la frecuencia de los archivos de tipo de extracción diferencial, simplemente puede trabajar con archivos de tipo de extracción completa. Sin embargo, la excepción podría ser si necesita entregar un informe en un período de tiempo muy corto, por ejemplo, antes del día 5 del mes para los datos del mes anterior, y la programación para el Completo no se alinea.
También es posible que, en función de su entorno de informes y de la actividad que tenga en Brightspace, los conjuntos de datos completos se vuelvan difíciles de descargar y procesar, y que sea más fácil trabajar con los archivos diferenciales.
¿Los datos son los mismos en el conjunto de datos completo y en el conjunto de datos diferencial?
Para la mayoría de los propósitos, los datos son los mismos, pero hay dos situaciones en las que los datos que tiene pueden diferir entre los tipos de extracción. La diferencia se debe al tiempo de entrega y a la diferencia en la generación de datos (registro de cambios desde el último extracto frente a instantánea del estado actual). Dado que los archivos diferenciales se entregan con más frecuencia que los archivos completos, verá datos más recientes en ellos que el conjunto de datos completos más reciente, a menos que se hayan generado al mismo tiempo. Además, debido a que los archivos diferenciales son todos los cambios que ocurrieron dentro de un tiempo determinado, podría ver que un valor, por ejemplo, el nombre de pila de un usuario, se cambia y luego se vuelve a cambiar al valor original en el conjunto de datos diferencial, mientras que el siguiente conjunto de datos completo generado solo mostraría el cambio más reciente.
¿Puedo usar los archivos diferenciales pero no los archivos completos?
En general, sí, con 2 excepciones. En primer lugar, necesitará una importación inicial del conjunto de datos completo para superponer los cambios en los archivos diferenciales. Si no lo hace, perderá filas en los conjuntos de datos que no cambian. Por ejemplo, si tiene 1.000 usuarios en su sistema pero solo utiliza los archivos diferenciales, verá los 200 nuevos estudiantes que se inscriben por primera vez este trimestre, y los 50 estudiantes que tuvieron un cambio en su nombre o información desde que comenzó a recopilar datos, pero le faltarán los datos de todas las personas que permanecen en su sistema del período anterior sin cambios en su información. La segunda excepción serían los archivos que no tienen un campo de eliminación temporal en su estructura. Un campo de eliminación temporal es una columna dentro del extracto que indica si la fila se ha eliminado. Las extracciones que tienen eliminaciones permanentes significan que la fila se elimina por completo de la extracción. Para esos archivos, solo sabría que se han eliminado haciendo referencia al archivo de extracción completa: las acciones de eliminación permanente no están en el archivo de extracción diferencial, solo se incluyen las inserciones y las actualizaciones. En este caso, la eliminación temporal se considera una actualización.
¿Cómo sé que todo lo que acabas de decir no cambiará mañana y romperá mi proceso? ¿Tengo que seguir revisando todos los archivos, incluso los que no estoy usando, solo para asegurarme de que no me falta ningún dato que pueda querer?
¡No te preocupes! Nos hemos comprometido con una política de gestión de cambios para los conjuntos de datos que debería darle tiempo suficiente para adaptarse a los cambios que se avecinan. Puedes encontrar más información aquí.
También es útil seguir el Actualizaciones de conjuntos de datos de Brightspace discusión en la comunidad de Brightspace para que se le notifique cuando haya nuevas versiones disponibles.
Si tiene más preguntas sobre los tipos de extracción de conjuntos de datos de Brightspace que no abordamos en este artículo, ¡comente a continuación!
¿Necesita más ayuda para trabajar con datos? ¿Atascado en alguno de los conceptos anteriores? ¿Le falta uno de los conjuntos de habilidades necesarios? D2L proporciona niveles flexibles de servicios de consultoría de soluciones de datos que pueden ayudar con cualquiera o todos los pasos del proceso detallado en esta publicación. Si está interesado, póngase en contacto con su representante de éxito del cliente de D2L.