Abstract: Wir präsentieren einen Ansatz, um Annotationsdaten von molekularbiologischen Objekten wie Genen, Proteinen und Pathways aus öffentlichen Datenquellen für datenintensive Expressionsanalysen verwendbar zu machen. Die Expressionsdaten sind mit Experimentbeschreibungen physisch in einem Data Warehouse integriert, um schnelle Auswertungen zu unterstützen. Die öffentlichen Annotationsdaten werden virtuell über einen Mediatoransatz integriert und bedarfsgesteuert für Analysen abgerufen. Für die einheitliche Anbindung der Datenquellen wird das verbreitete Tool SRS (Sequence Retrieval System) der Fa. LION bioscience genutzt. Die Kopplung zwischen dem Warehouse und SRS erfolgt über einen Query-Mediator unter Nutzung explizit gespeicherter Beziehungen (Mappings) zwischen den Instanzen der öffentlichen Datenquellen. Dieser hybride Integrationsansatz wurde als Erweiterung des Leipziger Data Warehouse für Genexpressionsdaten (http://www.izbi.de/GEWARE) implementiert und wird fü...