International Human Genome Sequencing Consortium kündigt "Arbeitsentwurf" des menschlichen Genoms an

International Human Genome Sequencing Consortium kündigt "Arbeitsentwurf" des menschlichen Genoms an
International Human Genome Sequencing Consortium kündigt "Arbeitsentwurf" des menschlichen Genoms an
Anonim

Das öffentliche Konsortium des Human Genome Project gab heute bekannt, dass es einen Arbeitsentwurf der Sequenz des menschlichen Genoms zusammengestellt hat - die genetische Blaupause für ein menschliches Wesen. Dieser wichtige Meilenstein umfasste zwei Aufgaben: große DNA-Fragmente in die richtige Reihenfolge zu bringen, um alle menschlichen Chromosomen abzudecken, und die DNA-Sequenz dieser Fragmente zu bestimmen.

Die heute gemeldete Assemblierung besteht aus überlappenden Fragmenten, die 97 Prozent des menschlichen Genoms abdecken, deren Sequenz bereits für etwa 85 Prozent des Genoms zusammengesetzt wurde.Die Sequenz wurde zu einer Reihe von As, Ts, Cs und Gs zusammengefädelt, die entlang der Länge der menschlichen Chromosomen angeordnet sind.

Die Produktion von Genomsequenzen ist im vergangenen Jahr sprunghaft angestiegen, wobei mehr als 60 Prozent der Sequenz allein in den letzten sechs Monaten produziert wurden. Während dieser Zeit hat das Konsortium 1000 Basen pro Sekunde Rohsequenz produziert – 7 Tage die Woche, 24 Stunden am Tag.

Die durchschnittliche Qualität der „Working Draft“-Sequenz übertrifft bei weitem die ursprünglichen Erwartungen des Konsortiums an dieses Zwischenprodukt.

Zentren des Konsortiums haben weit mehr Sequenzdaten produziert als erwartet (über 22,1 Milliarden Basen an Rohsequenzdaten, bestehend aus überlappenden Fragmenten von insgesamt 3,9 Milliarden Basen und einer 7-fachen Sequenzabdeckung des menschlichen Genoms).

Infolgedessen ist der „Arbeitsentwurf“wesentlich näher an der endgültigen „fertigen“Form, als das Konsortium zu diesem Zeitpunkt erwartet hatte. Ungefähr 50 Prozent der Genomsequenz sind in nahezu „fertiger“Form oder besser und 24 Prozent davon sind in vollständig „fertiger“Form.Im gesamten Genom befindet sich das durchschnittliche DNA-Segment in einer kontinuierlichen, lückenlosen Sequenz „Contig“von 200.000 Basen. Die durchschnittliche Genauigkeit aller DNA-Sequenzen in dieser Anordnung beträgt 99,9 Prozent.

Die Sequenzinformationen aus dem öffentlichen Projekt wurden kontinuierlich, sofort und kostenlos weltweit veröffentlicht, ohne Beschränkungen hinsichtlich ihrer Verwendung oder Weiterverbreitung. Die Informationen werden täglich von Wissenschaftlern in Wissenschaft und Industrie sowie von kommerziellen Datenbankunternehmen, die Informationsdienste für Biotechnologen anbieten, gescannt.

Aus der Genomsequenz wurden bereits viele zehntausend Gene identifiziert. Die Analyse der aktuellen Sequenz zeigt 38.000 vorhergesagte Gene, die durch experimentelle Beweise bestätigt wurden. Es gibt viele tausend zusätzliche Genvorhersagen, die experimentell getestet werden müssen. Durch den Zugriff auf den Arbeitsentwurf wurden Dutzende von Krankheitsgenen identifiziert.

Ziele des Konsortiums. Das Ziel des Konsortiums für das Frühjahr 2000 bestand darin, eine „Arbeitsentwurfs“-Version der menschlichen Sequenz zu erstellen, eine Baugruppe, die überlappende Fragmente enthält, die etwa 90 Prozent abdecken des Genoms und die in „Working Draft“-Form sequenziert werden, d.e.- mit einigen Lücken und Unklarheiten. Das ultimative Ziel des Konsortiums ist es, eine vollständig „fertige“Sequenz zu produzieren, d. h. eine Sequenz ohne Lücken und mit einer Genauigkeit von 99,99 Prozent. Das Zieldatum für dieses endgültige Ziel war 2003, aber die heutigen Ergebnisse bedeuten, dass die endgültige, die Zeit überdauernde Sequenz wahrscheinlich deutlich vor diesem Zeitplan produziert werden wird.

Komplementäre Ansätze. In einer ähnlichen Ankündigung gab Celera Genomics heute bekannt, dass es seine eigene erste Assemblierung der DNA-Sequenz des menschlichen Genoms abgeschlossen hat.

Die öffentlichen und privaten Projekte verwenden ähnliche Automatisierungs- und Sequenzierungstechnologien, aber unterschiedliche Ansätze zur Sequenzierung des menschlichen Genoms. Das öffentliche Projekt verwendet einen „hierarchischen Shotgun“-Ansatz, bei dem einzelne große DNA-Fragmente mit bekannter Position einer Shotgun-Sequenzierung unterzogen werden (d. h. in kleine Fragmente zerkleinert, sequenziert und dann auf der Grundlage von Sequenzüberschneidungen wieder zusammengesetzt werden).

Das Celera-Projekt verwendet einen „Whole Genome Shotgun“-Ansatz, bei dem das gesamte Genom in kleine Fragmente geschreddert wird, die sequenziert und auf der Grundlage von Sequenzüberschneidungen wieder zusammengesetzt werden.

Die hierarchische Shotgun-Methode hat den Vorteil, dass die globale Position jeder einzelnen Sequenz mit Sicherheit bekannt ist, aber sie erfordert die Erstellung einer Karte großer Fragmente, die das Genom abdecken. Die gesamte Shotgun-Methode erfordert diesen Schritt nicht, stellt jedoch andere Herausforderungen in der Montagephase dar.

Beide Ansätze richten die Sequenz entlang der menschlichen Chromosomen aus, indem sie Orientierungspunkte verwenden, die in der vom Human Genome Project erstellten physischen Karte enth alten sind.

"Die beiden Ansätze sind ziemlich komplementär. Das öffentliche Projekt und Celera planen, die relativen wissenschaftlichen Vorzüge der von den beiden Projekten verwendeten Methoden zu erörtern. Am Ende könnte der beste Ansatz durchaus eine Kombination der beiden sein Methoden zur Sequenzierung zukünftiger Genome", sagte Francis Collins, M.D., Ph.D., Direktor des National Human Genome Research Institute der National Institutes of He alth. Tatsächlich beinh alten aktuelle Pläne des öffentlichen Projekts zur Sequenzierung des Genoms der Labormaus diese Hybridstrategie.

Nächste Phase. Das Human Genome Project wird sich nun darauf konzentrieren, den „Arbeitsentwurf“und die nahezu „fertigen“Sequenzen in eine „fertige“Form umzuwandeln. Dazu werden die Lücken in der „Working Draft“-Sequenz gefüllt und die Genauigkeit der Gesamtsequenz auf 99,99 Prozent erhöht. Obwohl die „Working Draft“-Version für die meisten biomedizinischen Forschungen nützlich ist, ist eine hochgenaue Sequenz, die so perfekt wie möglich ist, entscheidend, um alle Informationen zu erh alten, die aus menschlichen Sequenzdaten gewonnen werden können. Dies wurde bereits für die Chromosomen 21 und 22 sowie für 24 % des gesamten Genoms erreicht.

Menschliche DNA-Variation. Die Sequenzproduktion, die größer als erwartet war, hat auch eine Rekordernte menschlicher genetischer Variationen hervorgebracht – sogenannte Einzelnukleotid-Polymorphismen oder SNPs. Das Humangenomprojekt hatte sich zum Ziel gesetzt, bis 2003 100.000 SNPs zu entdecken. Mit den heute gesammelten Sequenzen und anderen vom SNP-Konsortium gesammelten Daten haben Wissenschaftler bereits mehr als 300.000 SNPs gefunden und werden wahrscheinlich 1 Million SNPs haben Jahresende.Diese SNPs bieten ein leistungsfähiges Werkzeug für die Erforschung menschlicher Krankheiten und menschlicher Geschichte.

Hintergrund

Die Sequenzierung, die die genaue Reihenfolge der vier chemischen Basen der DNA bestimmt, die üblicherweise mit A, T, C und G abgekürzt werden, wurde im Human Genome Project durch technologische Fortschritte bei der Entschlüsselung von DNA und den kooperativen Charakter der Bemühungen beschleunigt, zu der etwa 1.000 Wissenschaftler weltweit gehören, die effektiv zusammenarbeiten.

Das Human Genome Sequencing Project zielt darauf ab, die Sequenz des euchromatischen Teils des menschlichen Genoms zu bestimmen. Der euchromatische Teil schließt bestimmte Regionen aus, die aus langen Abschnitten hoch repetitiver DNA bestehen, die wenig genetische Information kodieren und die in den vom Genomprojekt verwendeten Vektorsystemen nicht wiederhergestellt werden. Solche Regionen machen etwa 10 % des Genoms aus und gelten als heterochromatisch. (Zum Beispiel besteht das Zentrum von Chromosomen, Zentromere genannt, aus heterochromatischer DNA.)

Das internationale Konsortium zur Sequenzierung des menschlichen Genoms umfasst Wissenschaftler aus 16 Institutionen in Frankreich, Deutschland, Japan, China, Großbritannien und den Vereinigten Staaten. Die fünf größten Zentren befinden sich hier: Baylor College of Medicine, Houston, Texas; Gemeinsames Genominstitut in Walnut Creek, CA; Sanger Centre in der Nähe von Cambridge, England; Medizinische Fakultät der Washington University, St. Louis; und Whitehead Institute, Cambridge, Massachusetts. Zusammen haben diese fünf Zentren etwa 82 % der Sequenz erzeugt. Die folgende Liste enthält weitere Einzelheiten zu den 16 Zentren und ihren individuellen Beiträgen zum Human Genome Project.

Das Projekt wurde eng koordiniert, sodass keine Region des Genoms unbeaufsichtigt bleibt und Doppelarbeit minimiert wird. Die Teilnehmer des internationalen Konsortiums haben alle die Qualitätsstandards des Projekts und die Richtlinie zur täglichen Datenfreigabe eingeh alten. Das Projekt wird durch Zuschüsse von Regierungsbehörden und öffentlichen Wohltätigkeitsorganisationen in den verschiedenen Ländern finanziert.Dazu gehören das National Human Genome Research Institute der National Institutes of He alth, der Wellcome Trust in England und das US-Energieministerium.

Die Gesamtkosten für den Arbeitsentwurf belaufen sich weltweit auf etwa 300 Millionen US-Dollar, wobei etwa die Hälfte (150 Millionen US-Dollar) von den US National Institutes of He alth finanziert wird. Die Kosten für die Sequenzierung des menschlichen Genoms werden manchmal mit 3 Milliarden US-Dollar angegeben. Diese Zahl bezieht sich jedoch auf die ursprüngliche Schätzung der Gesamtfinanzierung für das Human Genome Project über einen Zeitraum von 15 Jahren (1990-2005) für ein breites Spektrum wissenschaftlicher Aktivitäten im Zusammenhang mit der Genomik. Dazu gehören Studien zu menschlichen Krankheiten, Versuchsorganismen (wie Bakterien, Hefen, Würmer, Fliegen und Mäuse), die Entwicklung neuer Technologien für die biologische und medizinische Forschung, Computermethoden zur Analyse von Genomen sowie ethische, rechtliche und soziale Fragen im Zusammenhang mit der Genetik.

- - - - - - - - - - - - - - - - - - - - -

Zu den sechzehn Institutionen, die das Human Genome Sequencing Consortium bilden, gehören:

1. Baylor College of Medicine, Houston, Texas, USA

2. Beijing Human Genome Center, Institut für Genetik, Chinesische Akademie der Wissenschaften, Peking, China

3. Gesellschaft für Biotechnologische Forschung mbH, Braunschweig, Deutschland

4. Genoskop, Evry, Frankreich

5. Genome Therapeutics Corporation, W altham, MA, USA

6. Institut für Molekulare Biotechnologie, Jena, Deutschland

7. Joint Genome Institute, U.S. Department of Energy, Walnut Creek, CA, USA

8. Keio-Universität, Tokio, Japan

9. Max-Planck-Institut für molekulare Genetik, Berlin, Deutschland

10. RIKEN Genomic Sciences Center, Saitama, Japan

11. The Sanger Centre, Hinxton, Großbritannien

12. Stanford DNA-Sequenzierung und Technologieentwicklungszentrum, Palo Alto, CA, USA

13. Genomzentrum der Universität von Washington, Seattle, WA, USA

14. University of Washington Multimegabase Sequencing Center, Seattle, WA, USA

15. Whitehead Institute for Biomedical Research, MIT, Cambridge, MA, USA16. Genomsequenzierungszentrum der Washington University, St.Louis, MO, USA

Darüber hinaus spielten zwei Institutionen im Laufe der letzten achtzehn Monate eine Schlüsselrolle bei der Bereitstellung von rechnergestützter Unterstützung und Analyse für das Human Genome Project. Dazu gehören:

Das National Center for Biotechnology Information at NIH

Das Europäische Bioinformatik-Institut in Cambridge, UK

Wissenschaftler der University of California, Santa Cruz, und Neomorphic, Inc. halfen auch beim Zusammenbau der Genomsequenz über Chromosomen hinweg.

Beliebtes Thema