Forscher skizzieren „Best Practice“bei der Analyse von Genexpressionsdaten

Forscher skizzieren „Best Practice“bei der Analyse von Genexpressionsdaten
Forscher skizzieren „Best Practice“bei der Analyse von Genexpressionsdaten
Anonim

Gene-Expression-Profiling gehört zu den am häufigsten verwendeten Analyseinstrumenten in der biomedizinischen Forschung und wird zur Vorhersage präklinischer und klinischer Endpunkte, z. Krankheitsdiagnose, Risikobewertung und Ansprechen auf die Behandlung. Die Zuverlässigkeit dieser Vorhersagen ist jedoch noch nicht erwiesen.

Johan Trygg und Max Bylesjö, Forscher an der Universität Umeå, haben an einem großen internationalen Projekt (MAQC-II) teilgenommen, das darauf abzielte, „Best-Practice“-Protokolle in der Datenanalyse zur Vorhersage klinischer Endpunkte auf der Grundlage von Genexpressionsdaten zu untersuchen und zu erstellen.Dieses Projekt wurde von der US-amerikanischen Food and Drug Administration (FDA) koordiniert und ist Teil der kürzlich gestarteten „Critical Path Initiative“für die Entwicklung medizinischer Produkte. Die Forscher der Universität Umeå trugen mit ihrer Expertise in der als Chemometrie bekannten multivariaten Datenanalysetechnik bei.

Die Ergebnisse wurden in der neuesten Ausgabe der Zeitschrift Nature Biotechnology veröffentlicht.

Genexpressionsdaten können zur Diagnose, Früherkennung (Screening) und Vorhersage des Ansprechens auf die Behandlung verwendet werden. Die Zuverlässigkeit des vorhergesagten klinischen Endpunkts kann jedoch die Ergebnisse stark beeinflussen. In diesem Projekt wurden Genexpressionsprofile für 13 verschiedene Endpunkte aus mehr als 3100 Proben, darunter Brust- und Lungenkrebs, von 36 unabhängigen Analyseteams analysiert, die mehr als 30.000 Vorhersagemodelle für diese 13 Endpunkte generierten. Dies stellt eine einzigartige Ressource für Regulierungsbehörden und Wissenschaftler dar.

"Obwohl das primäre Ziel nicht darin bestand, einzelne Beiträge zu bewerten, war ich sehr erfreut zu sehen, dass unsere OPLS-Vorhersagemodelle so gut funktionierten und für einen der 13 Endpunkte den höchsten Rang einnahmen", sagt Johan Trygg, außerordentlicher Professor, Computational Life Science Cluster (CLiC) an der Universität Umeå, Koordinator der schwedischen Bemühungen.

Es wurde viel Mühe in die Struktur und Überprüfung des Datenanalyseprotokolls, die Generierung von 36 Kandidatenmodellen und die statistische Validierung, einschließlich verblindeter Validierungssets, gesteckt. Drei Beobachtungen wurden besonders hervorgehoben. (1) Die Leistung der Vorhersagemodelle hängt weitgehend von der Qualität und Relevanz der Daten ab (2) Die Erfahrung und Kompetenz des Datenanalyseteams sind entscheidende Erfolgsfaktoren (3) Unterschiedliche Vorhersagemethoden führen zu ähnlichen Vorhersageergebnissen.

Das Verständnis der Einschränkungen bei der Verwendung von Genexpressionsdaten zur Vorhersage klinischer Endpunkte ist entscheidend für die Formulierung allgemeiner Richtlinien und Verfahren für eine sichere und wirksame Anwendung, z.g. Entwicklung diagnostischer Tests. Die „Best-Practice“-Richtlinien, die durch diese beispiellose Zusammenarbeit bereitgestellt werden, bieten eine solide Grundlage für andere Arten von hochdimensionalen biologischen Daten wie Proteine ​​und Metaboliten, die für die personalisierte Medizin verwendet werden sollen.

Beliebtes Thema