Genetische en genomische data bij CGN-accessies

- dr.ir. TG (Erik) Wijnker
- Onderzoeker genenbank methodieken
De beschikbaarheid van genetische en genomische data voor plantmateriaal neemt snel toe - ook voor materiaal binnen de CGN-collecties. Deze gegevens spelen een steeds belangrijkere rol bij onderzoek en veredeling. Daarom heeft het CGN recent geïnventariseerd voor welke accessies genetische data publiek beschikbaar zijn, en deze samengevat in downloadbare overzichten voor haar gebruikers.
De CGN-collecties zijn al decennia een belangrijke bron voor genetisch onderzoek. Door DNA van wilde soorten uit het volledige verspreidingsgebied te vergelijken met dat van gecultiveerde rassen wereldwijd, kunnen onderzoekers veel afleiden over de veredelingsgeschiedenis van gewassen. Vragen als “Waar vond de domesticatie plaats?”, “Hoe verspreidde dit gewas zich over de wereld?” en “Waar is de genetische diversiteit het grootst?” worden op deze manier beantwoord. CGN-collecties zijn hiervoor bijzonder geschikt doordat zij zowel gecultiveerde vormen als wilde verwanten uit het gehele verspreidingsgebied bevatten.
Genetische data hebben ook directe waarde voor veredeling. Wanneer bekend is welke genetische merkers samenhangen met eigenschappen zoals resistentie of bloeitijd, kunnen kiemplanten al vroeg geselecteerd worden voor die eigenschap. Volledige genoomsequenties bieden bovendien inzicht in de genetische basis van eigenschappen, wat de ontwikkeling van nieuwe rassen verder versnelt.
Het inventariseren van beschikbare datasets was niet eenvoudig. Genetische data worden meestal via wetenschappelijke publicaties beschikbaar gesteld, maar er bestaat geen gestandaardiseerde manier waarop deze gegevens worden gepresenteerd. Studies verschillen sterk in hoe accessies worden aangeduid, waardoor CGN-nummers soms lastig terug te vinden zijn of geheel ontbreken. Dankzij de expertise binnen de gewasteams en actief contact met gebruikers is toch een betrouwbaar overzicht samengesteld.
Per gewas zijn downloadbare Excel-overzichten opgesteld waarin is vastgelegd welke accessies in welke studies zijn gebruikt en welk type data beschikbaar is (bijvoorbeeld SNP- of whole-genome sequencing data). De beschikbaarheid varieert sterk per gewas: voor spinazie zijn whole genome sequenties beschikbaar voor slechts twee accessies, terwijl voor sla al 519 accessies gesequenced zijn. Op dit moment zijn overzichten beschikbaar voor zes gewassen: sla, spinazie, meloen, tomaat, paprika en aubergine. Binnenkort worden ook files voor rucola en aardappel toegevoegd. Deze overzichten zijn onder andere te vinden via de website voor CGN-databestanden door daar het gewenste gewas te selecteren, en het bestand te downloaden.
In het CGN-zoek- en bestelsysteem kunnen gebruikers nu bovendien direct alle accessies selecteren waarvoor genetische en/of sequencing data beschikbaar zijn. Wie bij het zoek en van accessies voor bijvoorbeeld meloen in de catalogus een vinkje zet bij “sequencing data”, krijgt direct alle 24 accessies te zien waarvoor sequencing data beschikbaar zijn. Via de “description” in het selectieveld vinden gebruikers ook daar de link naar het bijbehorende Excel-overzicht.
Hoewel het aantal genomische datasets momenteel nog beperkt is, zal dit de komende jaren waarschijnlijk sterk toenemen. Sequentiedata zullen dan een steeds belangrijkere informatiebron vormen, zowel als aanvulling op als ter verificatie van paspoortgegevens. Voor nu bieden de overzichten vooral helderheid voor gebruikers én een systematische manier voor het CGN om genetische informatie toegankelijk te maken. Suggesties voor verdere verbetering van de bruikbaarheid zijn van harte welkom.
Contact
Heeft u een vraag over dit onderwerp? Neem contact op met onze expert.