Oorspronkelijk gepubliceerd op 13 november 2019
Brightspace-datasets zijn er in twee verschillende extractietypen: differentieel en volledig. Als het werken met Brightspace-datasets nieuw voor u is, weet u misschien niet met welk type dataset u moet werken, of zelfs wat de verschillende gebruiksscenario's zijn voor elk type. In dit artikel willen we enkele misvattingen en veelgestelde vragen over het werken met deze verschillende soorten extractie ophelderen.
Hoe zijn volledige en differentiële datasets vergelijkbaar?
- Beide typen gegevenssets hebben hetzelfde gegevensschema en worden volgens een schema gegenereerd.
- Ze zijn beide beschikbaar om te downloaden als gecomprimeerde csv-bestanden.
- Alle velden met gegevens (kolommen) en benoemde bestanden (bijv. gebruikersaanmeldingen) die in het ene extractietype beschikbaar zijn, zijn ook beschikbaar in het andere.
- Beide volgen hetzelfde beleid en dezelfde planning voor wijzigingsbeheer hier.
Wat is het verschil tussen de volledige en differentiële datasets?
Volledige datasets
- 'Snapshots' van gegevens op het moment dat de volledige dataset wordt gegenereerd
- Bedoeld om een eerder volledig gegevenssetbestand te vervangen; Niet gebruikt in combinatie met eerdere volstoffen
- Genereert standaard wekelijks, dagelijks met betaalde upgrade
- Beperkt tot 150 miljoen rijen met de meest recente gegevens
Differentiële datasets
- 'Record van wijzigingen' in de gegevens sinds het vorige differentiaalbestand is gegenereerd
- Bedoeld om te worden toegevoegd aan (door het invoegen of bijwerken) van een gegevensarchief met eerder geëxtraheerde gegevens
- Genereert standaard dagelijks, elk uur met betaalde upgrade
- Gezien het beperkte tijdsbestek waarbinnen differentiëlen worden geëxtraheerd, mag nooit een limiet voor het aantal rijen worden bereikt
De bestanden zijn allemaal tekenreeksgegevens, maar de Core Admin Analytics Guide zegt dat het verschillende gegevenstypen moeten zijn, heb ik de juiste bestanden?
Ja, dat doe je! Wij leveren de gegevens aan u in string/tekst-indeling, zodat deze met bijna elke tool of elk systeem kunnen worden gebruikt. U moet de gegevens van tekenreeksvelden voor gebruik naar het juiste gegevensformaat converteren.
Als ik slechts wekelijks of minder vaak hoef te rapporteren, is er dan een reden om differentiële bestanden te gebruiken?
Over het algemeen niet - als u de frequentie van bestanden van het type differentiële extractie niet nodig hebt, kunt u gewoon werken met bestanden van het volledige extractietype. De uitzondering kan echter zijn als u een rapport in een zeer korte periode moet omdraaien, bijvoorbeeld op de 5e van de maand voor gegevens van de vorige maand, en het schema voor het volledige rapport niet op één lijn ligt.
Afhankelijk van je rapportageomgeving en de activiteit die je in Brightspace hebt, kan het ook zijn dat de volledige datasets onpraktisch worden om te downloaden en te verwerken en dat het gemakkelijker is om met de differentiële bestanden te werken.
Zijn de gegevens hetzelfde in de volledige gegevensset en de differentiële gegevensset?
Voor de meeste doeleinden zijn de gegevens hetzelfde, maar er zijn twee situaties waarin de gegevens die u hebt kunnen verschillen tussen extractietypen. Het verschil is te wijten aan de leveringstiming en het verschil in gegevensgeneratie (registratie van wijzigingen sinds het laatste extract versus momentopname van de huidige status). Omdat de differentiële bestanden vaker worden geleverd dan volledige bestanden, ziet u er nieuwere gegevens in dan de meest recente volledige gegevensset, tenzij ze op hetzelfde moment zijn gegenereerd. Omdat de differentiële bestanden alle wijzigingen zijn die binnen een bepaalde tijd hebben plaatsgevonden, kunt u bovendien zien dat een waarde - bijvoorbeeld de voornaam van een gebruiker - wordt gewijzigd en vervolgens weer wordt gewijzigd in de oorspronkelijke waarde in de differentiële gegevensset, terwijl de volgende gegenereerde volledige gegevensset alleen de meest recente wijziging zou tonen.
Kan ik de differentiële bestanden gebruiken, maar niet de volledige bestanden?
Over het algemeen wel, met 2 uitzonderingen. Eerst hebt u een eerste import van de volledige gegevensset nodig om de wijzigingen in de differentiële bestanden over elkaar heen te leggen. Doe je dit niet, dan mis je rijen in datasets die niet veranderen. Als u bijvoorbeeld 1.000 gebruikers in uw systeem heeft, maar alleen de differentiële bestanden gebruikt, ziet u de 200 nieuwe studenten die zich voor het eerst dit semester inschrijven, en de 50 studenten die een wijziging in hun naam of informatie hebben ondergaan sinds u begon met het verzamelen van gegevens, maar u mist de gegevens van alle personen die in uw systeem blijven van het vorige semester zonder wijzigingen in hun informatie. De tweede uitzondering zijn bestanden die geen soft delete-veld in hun structuur hebben. Een veld voor voorlopig verwijderen is een kolom in het uittreksel die aangeeft of de rij is verwijderd. Extracten met harde verwijderingen betekenen dat de rij gewoon volledig uit het extract wordt verwijderd. Voor die bestanden zou je alleen weten dat ze zijn verwijderd door te verwijzen naar het volledige extractiebestand - harde verwijderingsacties staan niet in het differentiële extractiebestand, alleen invoegingen en updates zijn inbegrepen. In dit geval wordt de voorlopig verwijderen beschouwd als een update.
Hoe weet ik dat alles wat je hierboven hebt gezegd morgen niet zal veranderen en mijn proces zal doorbreken? Moet ik alle bestanden blijven controleren, zelfs de bestanden die ik niet gebruik, om er zeker van te zijn dat ik geen gegevens mis die ik misschien wil?
Maak je niet druk! We hebben ons gecommitteerd aan een beleid voor wijzigingsbeheer voor de datasets dat u voldoende tijd moet geven om u aan te passen aan komende wijzigingen. U kunt meer informatie vinden hier.
Het is ook handig om de Updates voor Brightspace-gegevenssets discussie op Brightspace Community, zodat je op de hoogte wordt gebracht wanneer er nieuwe versies beschikbaar zijn.
Als je meer vragen hebt over de extractietypen van Brightspace-gegevenssets die we in dit artikel niet hebben behandeld, kun je hieronder reageren!
Meer hulp nodig bij het werken met data? Zit je vast op een van de bovenstaande concepten? Ontbreekt het aan een van de benodigde vaardigheden? D2L biedt flexibele niveaus van Data Solutions Consulting-diensten die kunnen helpen bij alle stappen in het proces die in dit bericht worden beschreven. Als u geïnteresseerd bent, neem dan contact op met uw D2L Customer Success-vertegenwoordiger.