Thys3
Database-software voor biologische waarnemingen
 

Introductie

Thys3 is de werknaam voor een databasesysteem dat de basis gaat vormen voor de nieuwe Windows-versies van de programma's QBWat en SynDiaT.
Het databasesysteem zal ook als zelfstandig derde generatie opslagsysteem voor biologische waarnemingen worden ontwikkeld.
De essentie van het systeem is dat het omgaat met meerdere soortenlijsten die onderling zijn gekoppeld. Het is systeem is daardoor in staat onderscheid te maken tussen naamgeving volgens determinatiewerken, volgens standaardlijsten, volgens beoordelingssystemen en eigen praktijknamen. Daardoor kan het waarnemingen duurzaam beheren zonder de noodzaak de data zelf te updaten als er een nieuwe standaard komt en data uitwisselen volgens alle denkbare standaarden; waar ook ter wereld in gebruik en wanneer dan ook, inclusief beoordelings- en indicatorsystemen die met verouderde standaarden werkt.
Verder heeft het programma een aantal andere mogelijkheden die momenteel door geen enkele vergelijkbare database goed worden ondersteund en dient primair om te laten zien hoe het beter kan. Software-ontwikkelaars wordt uitdrukkelijk uitgenodigd de hier ontwikkelde principes over te nemen.
Deze software is een volwassenwording van wat ooit in 1994 begon als OpName2.

Soortnamen

Een belangrijk probleem met databases voor biologische gegevens is hoe er wordt omgegaan met de naamgeving van soorten (en andere taxa) als er moet worden uitgewisseld met anderen. De oorzaak van dit probleem is dat de naamgeving voordurend verandert en onderhevig is aan interpretaties. Dit is niet betrouwbaar te ondervangen met een standaardlijst. Een betere oplossing is om meerdere soortenlijsten naast elkaar te gebruiken en daar een koppeling tussen te maken. Waarnemingen worden dan opgslagen volgens de naam waarmee ze zijn geïdentificeerd en dat is dan automatisch gekoppeld aan het identificatiewerk. Voor uitwisseling van data wordt vervolgens tijden het exporteren van uitwisselingsbestanden eventueel geconverteerd naar een standaardlijst naar keuze via die koppeling. De nieuwste inzichten in de naamgeving en de interpretatie van de naamgeving van de verschillende indentificatiewerken zijn verwerkt in de koppelingstabel.

Scores

De hoeveelheid die van een soorten is waargenomen wordt bijna nooit in een enkele getal uitgedrukt. Toch werken de meeste databases met één getal voor iedere soort. Dat is onhandig en onbetrouwbaar.
In plaats van een enkele getal als meetwaarde per soort moet de oorspronkelijke betekenis van de waarneming worden bewaard en eventueel ook meerdere scores voor dezelfde waarneming. Dat betekent dat de score betekenisvol wordt en gedocumenteerd wordt (door de software) waardoor ook gecontroleerde conversie naar numerieke waarden mogelijk is bij export van de gegevens, afhankelijk van de toepassing ervan.

Het idee is niet echte nieuw

Het in 1996 ontwikkelde programma OpName2 voldeed al aan deze specificaties, maar is nooit 'marktrijp' geworden. De programma's SynDiaT en QBWat maakten echter gebruik van de database-kern van OpName2 waardoor ze konden doen wat ze doen: zowel het vergelijken van gegevens uit een willekeurige database met een referentie uit een database met niet noodzakelijkerwijs dezelfde standaardlijst als het hanteren van complexe scores voor indicatorsoorten. Al deze programma's zijn ontwikkeld in TurboPascal 7 onder MS-DOS en werken niet meer onder een Windows 64-bits systeem.

Gebruik door derden

Thys3 wordt primair ten behoeve van de verdere ontwikkeling van SynDiaT en QBWat ontwikkeld, maar moet ook als voorbeeld dienen voor ontwikkelingen in de database software zelf. Daarvoor wordt het ook als een zelfstandig werkend databasepakket ontwikkeld. De praktijk heeft geleerd dat alleen een volledig werkend programma kan aantonen dat het ook werkt. Iedereen die de ontwikkeling ondersteunt kan daar ook van profiteren. Mocht de ontwikkeling niet door anderen worden overgenomen, dan wordt Thys3 uiteindelijk concurrerend op de markt gebracht.

Deelname

Er zijn zoveel soortenlijsten als er determinatiewerken zijn. Om deze te kunnen gebruiken moeten de namenlijsten worden verzameld. Dit kan alleen met een gebruikersgemeenschap die helpt de lijsten aan te leggen. Informatie over mogelijkheden tot deelname volgt. Wil je alvast per email op de hoogte blijven van de ontwikkelingen? Stuur even een mailtje.

Referenties

  • Roelf Pot, 2011. Twee vensters op de zelfde waarheid: over een verantwoord gebruik van TWN. WEW-nieuwsbrief 24, pp 21-22.
  • Roelf Pot, in prep. Boek over databases voor biologische data.