Ensembl on Euroopan bioinformatiikan instituutin ja Sanger-instituutin yhteenliittymä, joka on perustettu vuonna 1999 Human Genome Projectin valmistuttua. Ensemblin tehtävä on tarjota keskitetty tietolähde genetiikan, molekyylibiologian ja muiden selkärankaisten genomeja tutkivien tutkijoiden käyttöön.

Ensemblin kanssa vastaavia biologisia tietokantoja on NCBI:llä ja Kalifornian yliopistolla.

Tausta

muokkaa

Ihmisen genomi sisältää kolme miljoonaa emäsparia, jotka ovat koodattu 20 000–25 000 geeniin. Pelkällä genomilla on vain vähän käyttöä, mikäli geenien sijaintia ja keskenäisiä vuorovaikutuksia ei kyetä tunnistamaan. Yhtenä vaihtoehtona on käsityönä tehtävä geenien selvittäminen. Tässä tavassa joukko tutkijoita yrittää paikallistaa geenejä hyödyntäen tutkimustyössä syntynyttä dataa ja julkisia tietokantoja. Tämä on hidas tapa. Toinen tapa on automaattinen tiedonetsintä, jossa käytetään tietokoneiden laskentatehoa sekvenssien laskemiseen.

Ensembl-projektissa sekvenssidata on purettu muistiinpanosysteemiin (kokoelmaan ohjelmaputkia jotka on kirjoitettu Perlillä), joka tekee tunnettujen geenien sijainnista tietokannan ja tallentaa ne MySQL-tietokantaan tulevaa analysointia ja käyttöä varten. Ensembl tekee datasta vapaasti saatavaa tutkijoiden käyttöön. Kaikki Ensemblin tuottama data ja ohjelmakoodi on ladattavissa ja käyttäjille on olemassa myös julkinen tietokantapalvelin. Ensemblin nettisivusto tarjoaa myös visuaalisia näkymiä kerättyyn dataan.

Ajan kanssa projekti on laajentunut kattamaan keskeisiä tutkimustyössä käytettäviä eläimiä kuten hiiriä, banaanikärpäsiä ja seeprakaloja. Näiden lisäksi on laajempi kirjo genomin dataa kuten geenien muuntelua ja muita ominaisuuksia. Huhtikuusta 2009 lähtien sisarprojekti Ensembl Genomes on laajentanut tutkimuksia koskemaan kasveja, sieniä, bakteereja ja alkueliöitä alkuperäisen projektin keskittyessä selkärankaisiin.

Aiheesta muualla

muokkaa
 
Käännös suomeksi
Tämä artikkeli tai sen osa on käännetty tai siihen on haettu tietoja muunkielisen Wikipedian artikkelista.
Alkuperäinen artikkeli: en:Ensembl genome database project
Tämä biologiaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.
  NODES
OOP 1
os 8