W 2001 roku międzynarodowe naukowe konsorcjum Human Genome Project, po ponad dekadzie badań, opublikowało dokładny opis sekwencji autosomów (odpowiadają za dziedziczenie cech z wyjątkiem tych sprzężonych z płcią), jak i obu rodzajów chromosomów płci. Dowiedzieliśmy się wówczas m.in., że każdy genom posiada przynajmniej 25 tys. genów a całkowita ilość informacji genetycznej w genomie jest mniejsza niż 800 megabajtów.

Dwa lata później opublikowano dokument stwierdzający zakończenie sekwencjonowania 99 proc. genomu z trafnością 99,99 proc. Kolejny punkt zwrotny nastąpił w 2006 roku. Poznano wówczas budowę największego, bo zawierającego ok. 8 proc. całej informacji genetycznej człowieka, chromosomu 1. To tam zlokalizowane są geny odpowiadające za predyspozycje m.in. do choroby Parkinsona, Altzheimera czy raka.

Każdy chromosom tworzy podwójna helisa nici DNA zbudowanych z czterech zasad określanych symbolami: A (adenina), T (tymina), G (guanina) i C (cytozyna). Kod genetyczny to sposób ułożenia tych liter w cząsteczce DNA. Na końcach każdego chromosomu zlokalizowane są tzw. telomery (w sumie 2 w każdym), fragmenty strukturalne zapewniające stabilność i zabezpieczające przed uszkodzeniem podczas kopiowania.

Jak we wszystkich dziedzinach nauki, odkrycia są na tyle dokładne, na ile precyzyjne są narzędzia którymi posługują się badacze. Nie inaczej jest z genomiką. Pierwsze techniki sekwencjonowania genów pochodzą z końca lat 70-tych (tzw. enzymatyczna metoda Sangera).

Kolejne dekady przynosiły nowe, dokładniejsze i zautomatyzowane sposoby odczytywania nici DNA. Podstawowy problem, z którym związek ma też opisywane tu odkrycie pełnej budowy chromosomu, dotyczy długości nici DNA, którą daje się za jednym razem odczytać.

W połowie lat 90-tych ubiegłego wieku wprowadzono do użycia nową technikę sekwencjonowania dużych genomów tzw. metodę shotgun (w polskiej literaturze nazywanej ”strzałem na ślepo”). Chodzi w niej o sekwencjonowanie dużej liczby (nawet setki tysięcy) losowo pofragmentowanych odcinków DNA a potem złożenie ich w komputerze. Tą metodą w 1996 roku uzyskano po raz pierwszy całkowity genom bakterii (Haemophilus influenzae).

Sekwencjonowanie genów II generacji, dostępne już na początku XX wieku umożliwiało jednoczesne sekwencjonowanie nawet miliona fragmentów DNA. Klejenie, nawet z pomocą komputera, pociętych kawałków pozostawia jednak miejsce na błędy.

Problem zawsze był ten sam: pocięte fragmenty kodu wyglądają bardzo podobnie i niezłą sztuką jest wiedzieć, jeżeli układa się je we właściwy sposób, ale też, ile razy w danej sekwencji powtarza się określony fragment. I tak powstawały luki.

- Powoli odkrywamy, że część z tych regionów z lukami to fragmenty DNA o tak wielkim zróżnicowaniu informacji genetycznej, że przez ich brak traciliśmy dostęp do olbrzymiej wiedzy o biologii człowieka – wyjaśnia biolożka Karen Miga z Instytutu Genomiki na uniwersytecie kalifornijskim w Santa Cruz. 

W tym miejscu historii pojawia się nowatorska technika sekwencjonowania wymyślona pod koniec pierwszej dekady XXI wieku przez brytyjską firmę Oxford Nanopore Technologies.