Beste gebruikers,
Ik ben blij dat ik het eerste artikel op de CopyrightCheck-ontwikkelingsblog mag schrijven. Het doel van deze blog is om onze gebruikers meer inzicht te geven in het CRC-ontwikkelingsproces: wat we onlangs hebben gedaan, wat er in de maak is en wat we van plan zijn in de toekomst te doen. Ik hoop dat de comment section ook een plek zal zijn waar we op een meer regelmatige basis feedback kunnen verzamelen dan de driemaandelijkse gebruikers overleggen. Natuurlijk is deze blog zelf ook een experiment en ik ben benieuwd naar feedback daarop.
Dus, het nieuws! Afgelopen sprint (Sprint 42) hebben we veel gedaan en hebben we versie 1.2.0 en 1.2.1 (tegelijkertijd) uitgebracht. We hebben wat onderhoudswerkzaamheden aan de code uitgevoerd en een aantal kleine bugs opgelost die ervoor zorgden dat er foutmeldingen in onze monitoring verschenen. Dit is niet zichtbaar voor jullie, maar het is belangrijk dat de codekwaliteit voortdurend verbetert.
Het belangrijkste nieuws is dat we een bug hebben opgelost die verband houdt met de manier waarop opnieuw geüpload materiaal wordt gedetecteerd. Deze bug zorgde ervoor dat sommige materialen die op afbeeldingen (scan) gebaseerde PDF's waren, als duplicaten werden gedetecteerd omdat hun tekstinhoud (leeg) overeenkwam met een bestaande PDF. De classificaties werden vervolgens ten onrechte op het nieuwe materiaal toegepast. We wisten dat als we dit zouden oplossen, we ook al het bestaande materiaal moesten “re-hashen” (de methode om duplicaten te vinden) en dit vergt erg veel rekenkracht, dus we wilden dit opgelost hebben voordat we nieuwe instellingen met elkaar zouden verbinden. Dankzij heel hard werken van onze ontwikkelaars, Benny en Nicole, hebben we dit opgelost en deze week is Menno druk bezig geweest met het aansluiten van nieuwe instellingen en het scannen van de LMS's.
Het andere grote item van de afgelopen sprint was het bouwen van de tool waarmee CopyrightCheck verbinding kon maken met een “iBron” (de instellingskant van het NL Bron-netwerk). Ik zal een apart blog post schrijven over waarom we hiervoor gekozen hebben (er is veel te vertellen), maar het is een lange weg geweest en we naderen het einde ervan. Op het moment dat ik dit schrijft zijn de laatste componenten gebouwd en zijn we klaar om te beginnen met testen, hopelijk afgerond tegen het einde van Sprint 43 (28 maart). Voor deze sprint zijn er ook twee bug fixes in voorbereiding waar onze Canvas-gebruikers blij mee zullen zijn: “Verwijderde bestanden worden niet weergegeven in rapporten” en “Bestanden worden niet gemarkeerd als verwijderd wanneer hun cursus wordt verwijderd/gedepubliceerd”.
Bedankt voor het lezen en blijf op de hoogte voor de volgende update!
Dear users,
I’m excited to be writing the first entry in the CopyrightCheck development blog. The purpose of this blog is to provide our users with more insight into the CRC development process: what we’ve recently done, what’s in the works, and what we’re planning to do in the future. My hope is that the comments will also be a place to collect feedback on a more regular basis than the quarterly gebruikers overleggen. Of course, this blog itself is also an experiment and I’m keen to hear feedback on it.
So, the news! Last sprint (Sprint 42), we got a lot done and released version 1.2.0 and 1.2.1 (at the same time). We did some maintenance work on the code and fixed several small bugs which were causing error messages to pop up in our monitoring. This isn’t visible to our users, but it’s important that the code quality is continuously improving.
The headline is that we fixed a bug related to how re-uploaded materials are detected. This bug caused some materials which were image-(scan)-based PDFs to be detected as being duplicates because their text content (empty) matched an existing PDF. The classifications were then erroneously applied to the new material. We knew that when we fixed this, we’d also have to “re-hash” (the method for finding duplicates) all existing materials and this is very computing-power intensive, so we wanted to get this fixed before connecting any new institutions. Thanks to very hard work from our developers, Benny and Nicole, we got this fixed and this week Menno has been busy connecting new institutions and scanning the LMS’s.
The other big-ticket item from last sprint was building the tooling for CopyrightCheck to connect to an “iBron” (the institution side of the NL Bron network). I will write a separate post about why we decided to go this route (there’s lots to tell there), but it’s been a long road and we’re approaching the end of it. At the time of writing, the last components are built and we’re ready to begin testing, hopefully completed by the end of Sprint 43 (28 March). Also in progress for this sprint are two bug fixes which will make our Canvas users happy: “Removed files are not reflected in reports” and “Files are not marked deleted when their course is deleted/unpublished”.
Thank you for reading and stay tuned for the next update!