Artikel
Entwurf und Implementierung einer Datenbank zur Analyse von Listen differentiell exprimierter Gene bei Leukämien
Suche in Medline nach
Autoren
Veröffentlicht: | 6. September 2007 |
---|
Gliederung
Text
Einleitung/Hintergrund: In den letzten Jahren haben sich Genexpressionsanalysen zu einem Standardverfahren zur Erforschung molekularbiologischer Ursachen von Krebserkrankungen entwickelt. Publikationen aus diesem Gebiet enthalten zahlreiche Genlisten, die mit diesen Erkrankungen assoziiert sind. Der Zugriff auf die Genlisten ist jedoch oft mit erheblichen Aufwand verbunden, da die Listen auf verschiedenen Web-Seiten in unterschiedlichen Formaten vorliegen. Wir haben eine Datenbank entworfen und implementiert, die einen einfachen Zugriff auf Listen differenziell exprimierter Gene bei Leukämien in einem einheitlichen XML-Format ermöglicht. Dadurch wird der Aufwand für die Durchführung von Metaanalysen und für Vergleiche von Genlisten reduziert.
Methoden: Zur Entwicklung der Datenbank wurde ein Entity-Relationship-Modell entworfen und in ein normalisiertes Datenbankschema überführt. Als relationales DBMS wurde PostgreSQL verwendet. Der Zugriff auf die Datenbank wird über eine in Java-EE implementierte SOAP-Schnittstelle ermöglicht. Einzelne Datenbankabfragen können zudem mit einem Web-Browser über HTTP-Servlets durchgeführt werden.
Ergebnisse: Einer Genliste werden die untersuchten Patientengruppen, die verwendete Microarray-Plattform und die zugehörige PubMed-ID zugeordnet. Jeder Eintrag in einer Genliste besteht aus seiner Rangnummer und einer GenBank-Accession-Number [Ref. 1]. Bei einem Vergleich von zwei Gruppen wird zusätzlich die Richtung (hoch- oder herunterreguliert) angegeben. Falls den Accession-Numbers bekannte Gene zugeordnet sind, werden durch Online-Abfragen der Entrez-Gene-Datenbank [Ref. 2] aktuelle genspezifische Informationen (z.B. HUGO-Symbole) ermittelt. Den untersuchten Patientengruppen werden neben Attributen wie Alter oder Herkunft des Zellmaterials Leukämiearten zugeordnet. Dazu wurde eine hierarchische Klassifikation von Leukämiearten modelliert, so dass Datenbankabfragen gezielt nach ca. 30 unterschiedlichen Leukämieunterarten durchgeführt werden können.
Wir haben ungefähr 60 relevante Genlisten aus 35 Artikeln identifiziert, welche in die Datenbank übertragen wurden. Eine systematische Analyse der Übereinstimmungen und Abweichungen publizierter Genlisten einzelner Leukämiearten wird erarbeitet und vorgestellt.
Diskussion: Die Datenbank ermöglicht die Durchführung von Metaanalysen einer großen Anzahl von Genexpressionsexperimenten bei Leukämien. Die Metaanalysen können direkt auf Genen, auf Distanzmaßen für Genlisten [Ref. 3] oder bspw. auf Gene-Ontology- oder Pathway-Analysen basieren. Zudem ermöglicht die Datenbank einen einfachen Vergleich von eigenen Genlisten mit bereits veröffentlichten Ergebnissen.
Literatur
- 1.
- Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Wheeler DL. GenBank. Nucleic Acids Res. 2006;34(Database Issue):D16-D20.
- 2.
- Maglott D, Ostell J, Pruitt KD, Tatusova T. Entrez Gene: gene-centered information at NCBI. Nucleic Acids Res. 2005;33(Database Issue):D54–D58.
- 3.
- Yang X, Bentink S, Scheid S, Spang R. Similarities of ordered gene lists. Bioinformatics and Computational Biology. 2006;4(3):693-708.