I et enormt studie netop publiceret, spredt over 30 artikler i tre forskellige tidsskrifter (Nature, Genome Research og Genome Biology), har 442 forskere fra over 32 forskellige institutioner i det såkaldte ENCODE-konsortium kastet nyt og spændende lys over såkaldt “junk” DNA. Altså den del af vores arvemateriale som vi hidtil ikke har kunne tilskrive nogen funktion.

De har sammenlagt udført >1600 eksperimenter i knap 150 forskellige celletyper og produceret data svarende til 15 terabytes(!) Hvis man skulle printe alle disse data ud, ville udskriften være 16 meter høj og mindst 30 km lang – vel at mærke hvis man var i stand til at få plads til 1000 karakterer per kvadratcentimeter. Det er meget data. Opsummeret viser dette utrolige stykke arbejde følgende:

Forsiden af Nature fra d. 6. september 2012
© Nature

  • Omkring 75% af genomet bliver transkriberet før eller siden i nogle celletyper
  • Hele 80% af genomet deltager i mindst én biokemisk RNA og/eller kromatin-associeret hændelse i mindste én celletype
  • 95% af genomet ligger indenfor 8kb af en DNA-protein interaktion
  • 99% af genomet ligger inden for 1.7kb af en af biokemiske hændelser registreret i ENCODE

Altså, stort set hele genomet ligger inden for 2000 baser af en eller anden biokemisk funktion. 2000 baser! I genomisk henseende er det et stenkast! Til sammenligning er det mindste menneskelige gen 500 baser langt og det største over to millioner.  Kan vi overhovedet tillade os at tale om junk DNA længere?

I årene siden strukturen af DNA-molekylet blev først beskrevet af Watson & Crick i 1953 er der sket meget. Vi har fundet ud af, at den genetiske kode består af fire baser (A, T, G og C). Sekventeringen af det første menneskelige genom blev gennemført i starten af 00’erne, et projekt som involverede hundredevis af forskere og kostede millioner af kroner. Vi anslår at der findes omkring 20.000 proteinkodende gener i genomet og at de udgør 1-2% af det totale DNA. Senere har man fundet ud af der også findes andre elementer i DNA-koden, som ikke oversættes til proteiner, men som er vigtige i reguleringen heraf. Men præcis hvor meget der er tale om og hvor vigtigt det er, har hidtil været lidt af et mysterium.

ENCODE-projektet viser entydigt, at vi ikke kan ignorere den del af DNA’et som vi ikke umiddelbart kender funktionen af. Hvis man udelukkende kigger på variationer i de kodende dele af genomet, vil man muligvis fange mutationer, som gør at et protein ikke fungerer optimalt. Men man vil til gengæld ikke fange en mutation uden for den kodende del, der evt. kan medføre en nedsat regulering, således proteinet i værste fald slet ikke produceres. Hvad er værst? En brækket arm – eller ingen arm overhovedet?

En del medicinsk forskning går på at finde sammenhænge mellem specifikke genetiske variationer og sygdomme. Inden for metabolisk forskning søger man efter steder i genomet som kan være bidragende til, at folk bliver fede og/eller udvikler metabolisk relaterede sygdomme som f.eks. type 2 diabetes. Når man leder i genomet, som består af 3 mia. baser, kan det være som at lede efter en nål i en høstak. Derfor bruger man ofte nogle genveje. Man kan f.eks. nøjes med at lave en genotyping eller en exom-sekventering. Disse metoder fortæller om op til godt 1% af den samlede arvemasse. Men hvad de resterende 99%? Kan man tillade sig at se bort fra dem? Med ovenstående fund må svaret siges at være et stort, rungende nej.

(featurebillede: modificeret udgave af Visual DNA)

Tagged with →  
Share →