Strona
Główna

Badania
Molekularne

Analiza
Statystyczna

Analiza
Informatyczna

Linki
Kontakt

Forum
Dyskusyjne



Tworzenie genetycznych map sprzężeniowych genomów zwierząt gospodarskich


          Jak już wspomniano markery mikrosatelitarne, charakteryzują się wysokim polimorfizmem oraz równomiernym rozmieszczeniem w genomie, nadają się, więc doskonale do tworzenia genetycznych map sprzężeniowych genomów zwierząt i oczywiście człowieka. Mikrosatelity, są, więc pomocne w zakrojonym na szeroką skale mapowaniu gnomów zwierząt. Chodzi tu szczególnie ilościowych geny cech ilościowych (Quantitative Trait Loci - QTL). Pomoc ta wynika ze znajomości sprzężeń pomiędzy łatwymi do identyfikacji mikrosatelitami a fenotypową ekspresją cech ilościowych zależnych od wielu innych genów.
          Od początku lat dziewięćdziesiątych XX wieku obserwuje się dynamiczny rozwój programów mapowania genomów zwierząt domowych. Cecha łączącą te przedsięwzięcia jest idea stworzenia takich map, które będą zawierały równomiernie rozproszone markery genetyczne, przy zachowaniu odległości między nimi nie większej niż 20cM (centymorganów). Dlaczego właśnie 20cM? Bo przy takim nasyceniu mapy dowolny gen występujący w genomie będzie oddalony od zmapowanego, sprzężonego z nim markera nie więcej niż o 10 cM. W pierwszym etapie konstrukcji mapy genetycznej jest zlokalizujemy oraz opisujemy w genomie jak największą liczbe loci markerowych takich jak mikro i makrosatelity oraz określenie odległości pomiędzy nimi. Pozwala to na konstrukcję mapy genomu o dużym nasyceniu markerami. Mapy takie dzielą się na dwa rodzaje; mapa fizyczna, zwana jest inaczej cytogenetyczna, która wskazuje położenie loci na określonym chromosomie lub bardziej szczegółowo w określonym miejscu na chromosomie, oraz mapa genetyczna, która zawiera informacja o odległościach genetycznych mierzonych w cM o raz o kolejności loci na chromosomie układach sprzężonych.
          Badania i tworzenie markerowych map genetycznych nie zwalnia a wręcz przeciwnie. Powodem tego jest zapotrzebowanie na mapy jak najbardziej nasycone markerami. Jak już wiemy nasycenie markerami łatwymi do identyfikacji co 20cM daje nam już doskonałe narzędzie. Jednak zrozumienie co oznacza wielkość "cM" daje nam do myślenia. Miarą oddalenia loci od siebie nie jest wielkość fizyczna porównywalna z takimi miarami jak skala metryczna. Odległość między dwoma genami leżącymi na tym samym chromosomie mierzy się jako odległość genetyczną a nie fizyczną. Jest to, więc częstość zachodzenia rekombinacji między rozpatrywanymi genami. Jeżeli między dwoma genami częstości zachodzenia rekombinacji odpowiadającą 1%, to na mapie genetycznej oznacza to 1 centymorgan (1cM). Oczywiste więc staje się że każdy chromosom stanowi odrębną mapę sprzężeń, gdyż segregacja w procesie mejozy i tworzenie się gamet jest niezależna. Każdy chromosom stanowi więc swego rodzaju grupę sprzeżeniową. Wszystkie geny w pojedynczym chromosomie stanowiłyby więc łącznie dziedziczącą się grupę sprzeżeniową gdyby nie "crossing over". Prawdopodobieństwo że przecięcie chromosomu podczas rekombinacji maleje nastąpi pomiędzy dwoma genami maleje wraz ze zbliżeniem się do siebie tych genów. A więc leżące blisko siebie na chromosomie geny mają większą szanse że przekazane zostaną potomstwu razem. Wynikałoby z tego że wielkość oddalenia fizycznego mniej więcej pokrywałaby się z odległością rekombinacjną. Przyjmuje się nawet orientacyjnie, że wielkość 1 centymorgana, czyli 1% rekombinacji, bywa przeliczany na fizyczną odległość 1 miliona par nukleotydowych. Pamiętać jednak należy że relacje takie są prawdziwe jedynie dla małych odległości. Innym problemem stają się fragmenty chromosomów o różnej częstości pęknięć. Odnaleziono między innymi fragmenty zwane tak zwanymi gorącymi gdzie ta częstość jest bardzo duża. Inne fragmenty mogą natomiast być bardzo konserwatywne i nie pękają tak często.
          Odległości genetyczne w jednostkach morganowskich są w przybliżeniu addytywne, czyli sumują się. Wydawać by się mogło, że cały chromosom stanowi, więc 100% czyli 100cM, co stanowiłoby jednostkę większą od, centymorgana, czyli byłby to jeden morgan. Jednak tak nie jest. Morgan to jednostka sprzężenia genetycznego takiej długości genetycznej chromosomu, na której w każdej mejozie zachodzi jeden crossing-over. Innymi słowy jest to odcinek, na którym w każdym podziale redukcyjnym zachodzi zjawisko crossing-over. To właśnie na tej długości prawdopodobieństwo wystąpienia tego zjawiska wynosi 100%. Chromosom jako całość średnio może mieć około 100-300 cM, co oznacza 1 do 3 crossing-over na każdą parę chromosomów homologicznych w każdej mejozie.
          Dopiero teraz jasne staje się, dlaczego odległość pomiędzy markerami wynosząca 20cM jest tak ważna. Oczywiście, gdy dostępne będą mapy genetyczne właśnie o takim nasyceniu markerami, nie zakończy to pracy nad nimi. Zrozumiałe jest, że im odległość ta będzie mniejsza tym lepiej. Nawet przy 10cM możliwa jest rekombinacja i rozdzielenie dwóch loci gdyż mamy tu 10% prawdopodobieństwo. Wynika z tego, że mamy 10% szans, że określony marker oderwie się od loci, które wskazuje. Spowoduje to oddzielne dziedziczenie się markera i genu wyznaczanego i marker przestanie wtedy być miarodajnym wskaźnikiem dla tego lokus. Zależy nam, więc na tym by markery były jak najbardziej sprzężone z genami, które wyznaczają, więc aby odległość tą zmniejszyć jeszcze poniżej 10 cM. Warto jeszcze wspomnieć, że częstość crossing-over w czasie oogenezy jest około dwa razy większa niż w czasie spermatogenezy. Co z tego wynika? Ten sam chromosom w zależności od tego czy jest mapowany na podstawie rekombinacji w gemetogenezie samic czy samców będzie miał znacznie inna długość mierzoną w cM. Chromosomy analizowane na podstawie orogenetycznych rekombinacji są znacznie dłuższe od tych samych analizowanych na podstawie spermatogenetycznych rekombinacji.
          Innym miernikiem oddalenia miejsc genowych może być również parametr nazywany frakcją rekombinacji ? (theta). Jest on miarą częstości zachodzenia rekombinacji pomiędzy dwoma loci. Przyjmuje on wartości od 0 do 0,5. Dysponując rodowodami kilku rodzin czy to zwierząt czy ludzi. Dokonujemy analizy genetycznej wszystkich członków rodzin przez co najmniej w dwa pokolenia. Analizując fenotyp potomstwa można określić, czy rekombinacja zaszła, czy też nie. Frakcja rekombinacji odpowiada proporcji tych przypadków, w których zdiagnozowano naruszenie reguły sprzężenia, w stosunku do genów z loci tego samego chromosomu. Do ogólnej liczby analizowanych przypadków przekazania cechy z rodziców na potomstwo. Podsumowując gdy wartości theta równa się 0 to oznacza że nie stwierdzono żadnej rekombinacji pomiędzy analizowanymi loci. Jest to równoznaczne z bardzo małą odległość loci między sobą. Maksymalna wartość jaką może frakcja theta przyjąć przy zupełnym braku sprzężenia wynosi 0,5. Oznacza to całkowitą przypadkową segregację, czyli niezależne dziedziczenie. Przypadek ten ma miejsce w sytuacji, gdy każdy z rozpatrywanych loci leży na innym chromosomie prawdopodobieństwo dziedziczenia się w następnym pokoleniu jest równe prawdopodobieństwu spotkania się w jednej gamecie, co przy losowej segregacji chromosomów podczas mejozy równe jest właśnie 0,5. W przypadku tym po skrzyżowaniu osobników AABB×aabb, potomstwo będzie heterozygotyczne AaBb. Potomstwo to produkowało będzie w równych proporcjach gamety o genotypie AB, ab, aB oraz Ab. Dwie ostatnie typy to właśnie rekombinanty. Wynika z tego, że przy niezależnym dziedziczeniu połowa wytwarzanych gamet to rekombinanty. Jeśli jednak empirycznie stwierdzimy, że rekombinantów jest mniej niż zakładane 50% oznacza to, że loci genów A i B są ze sobą sprzężone.
          Przejdźmy do bardziej rozbudowanego przykładu. Załóżmy, że w pokoleniu rodzicielskim posiadamy osobniki o genotypach w trzech rozpatrywanych loci na jednym chromosomie; bądź to ABC bądź abc. Po kojarzeniu tych osobników otrzymaliśmy 1000 sztuk potomstwa, u którego według zasad pełnego sprzężenia otrzymać powinniśmy osobniki, które na swych chromosomach posiadają liniowo ułożone allele ABC lub abc. Jeśli są homozygotami to homozygotyczność ta dotyczy wszystkich, alleli. Jeśli natomiast są heterozygotami to również mamy do czynienia z heterozygotycznością pod względem wszystkich alleli, i dodatkowo jeden chromosom z pary homologicznej posiada jedynie allele dominujące ABC a drugi tylko recesywne abc. Zasady te jednak nie obowiązują w pełni właśnie dzięki zjawisku crossing-over. Otrzymujemy, więc potomstwo na chromosomach, którego mamy liniowo ułożone bez zachowania zasady albo same dominujące albo same recesywne. Mamy, więc na przykład do czynienia z chromosomami ABc, aBc, aBC, itd. Spośród tysiąca osobników potomstwa cześć to rekombinanty. Właśnie te osobniki które jak gdyby odstają od ogólnych zasad pomagają nam w określaniu rekombinacyjnych odległości pomiędzy poszczególnymi loci na chromosomie. Co więcej pomagają jednocześnie określić wzajemne liniowe położeniu tych loci względem siebie. Pierwszym krokiem jest określenie genotypów osobników rekombinantów oraz dokładne wyliczenie ich liczebności.
          Przedstawimy przykładowe liczebności;


          W pierwszych dwóch grupach doszło do rekombinacji pomiędzy odcinkami AB i C. w trzeciej i czwartej pomiędzy A i BC. Natomiast piątej i szóstej doszło do podwójnego crossing-over pomiędzy A i B oraz C.
          Możemy teraz rozpocząć obliczanie odległości pomiędzy loci. Najpierw określamy odległość pomiędzy A i B. Sumujemy w tym celu wszystkie zrekombinowane osobniki z grup gdzie doszło do przerwania nici DNA pomiędzy tymi dwoma loci. Są to, więc oczywiście grupy 3 i 4 oraz 5 i 6 gdyż tam miał miejsce podwójny crossing-over, czyli również pomiędzy A i B. Otrzymaną sumą osobników zrekombinowanych dzielimy przez ilość wszystkich narodzonych osobników tym pokoleniu. Otrzymamy w ten sposób frekwencje rekombinantów pomiędzy loci A i B. Jeżeli teraz pomnożymy tę frekwencje przez 100 to wynik otrzymamy w procentach czyli jednocześnie w centymorganach. Mamy więc;


          Liczymy teraz odległość pomiędzy loci B i C. Sumujemy w tym celu wszystkie zrekombinowane osobniki z grup gdzie doszło do przerwania nici DNA pomiędzy tymi dwoma loci. Są to, więc oczywiście grupy 1 i 2 oraz 5 i 6 gdyż tam miał miejsce podwójny crossing-over, czyli również pomiędzy B i C. Otrzymaną w ten sposób sumę osobników zrekombinowanych dzielimy przez ilość wszystkich narodzonych osobników tym pokoleniu. Analogicznie więc, otrzymamy w ten sposób frekwencje rekombinantów pomiędzy loci B i C. Jeżeli teraz pomnożymy tę frekwencje przez 100 to wynik otrzymamy w procentach czyli jednocześnie w centymorganach. Mamy tym razem;


          Ostatnim etapem jest znalezienie odległości pomiędzy pierwszym i ostatnim loci, czyli A i C. Sumujemy tu więc liczebności wszystkich rekombinantów, najpierw pod względem loci A i B a następnie B i C. Sumę osobników zrekombinowanych dzielimy przez ilość wszystkich narodzonych osobników tym pokoleniu. Otrzymamy wtedy frekwencje rekombinantów pomiędzy loci A i C. Po pomnożeniu frekwencji przez 100 otrzymamy wynik w procentach czyli jednocześnie w centymorganach. Tym razem jest to;


          Wiemy teraz że pomiędzy A i B jest 19,5cM a pomiędzy B i C mamy 11,4cM. Wiemy również że pomiędzy A i C jest 30,9cM. Dzięki znajomości ich wzajemnych odległości możemy wywnioskować w jakiej kolejności loci te ułożone są na chromosomie. Są tu trzy możliwości do rozpatrzenia albo jest to ABC albo ACB bądź też BAC. Pozostałe kombinacje są jedynie odwróconymi sekwencjami tych trzech.
          Gdyby była to sekwencja ACB to po jednej ze stron od C w odległości 30,9cM byłby lokus A, po przeciwnej od C byłby B w odległości 11,4cM. Wynikałoby z tego że pomiędzy A i B odległość ta wynosiłaby 42,3cM. Jest to złe uszeregowanie gdyż wiemy że wynosi ona 19,5cM. Takie same błędne sprzeczne wnioski uzyskalibyśmy dla kolejności BAC. Jedynie sekwencja ABC daje nam prawidłowe wyniki gdyż suma 19,5cM i 11,4cM daje nam prawidłowy wynik 30,9cM.

A < 19,5cm > B < 11,4cm > C

          Odległość pomiędzy A i B jest większa gdyż już w tabelce widzieliśmy, że ilość osobników z rekombinacją pomiędzy tymi dwoma loci była większa od innych grup osobników. Dwie ostatnie stanowią najmniejsza grupy gdyż tam zajść musiały aż dwie rekombinacje. Obserwowana frekwencja podwójnych crossing-over to;


          Jest ona mniejsza od spodziewanej wynikającej obserwacji poszczególnych pojedynczych crossing-over. Przewidując częstość podwójnego crossing-over stosujemy prosty iloczyn pojedynczych rekombinacji, który w naszym przypadku wynosi;


          Zamiast więc 22,3 podwójnych rekombinantów mamy tu tylko 13 takich osobników co świadczy o stopniu interferencji czyli nakładaniu się chromatyd w tym rejonie. Wystąpienie crossing-over w pewnym rejonie zmniejsza prawdopodobieństwo wystąpienia go w pobliżu, co określamy jako interferencje. Stopień tej interferencji z angielskiego interferencje, obliczamy dzięki współczynnikowi koincydencji, czyli coefficient of coincidence. Jest to stosunek obserwowanych osobników z podwójnym crossing-over do spodziewanej frekwencji takich osobników.



          Wartość tą interpretować możemy jako średnią wielkość odcinaka na długości, którego w dochodzi do zbliżenia się chromatyd biwalentów, w stosunku do całej długości pomiędzy dwoma skrajnymi loci w tym przypadku A oraz C. Gdyby współczynnik koincydencji wynosił 1 lub w procentach 100, oznaczałoby to, że cały odcinek od A do C przylegałby do siebie. Wtedy do zachodzenie podwójnego crossing-over mogłoby zachodzić z częstością odpowiadającą iloczynowi każdego z pojedynczych rekombinacji. Do pełnego nakładania nie dochodzi zawsze i dlatego obserwowane wyniki są mniejsze od spodziewanych.
          Jak wszędzie tak i do obliczeń towarzyszących tworzeniu map sprzężeń genetycznych zaprzęgnięto komputery wraz ze specjalistycznym oprogramowaniem umożliwiające zastosowanie bardziej specjalistycznych i zaawansowanych obliczeń. Powszechnie stosuje się obecnie funkcję logarytmicznego ilorazu wiarygodności wraz z funkcją Kosambiego, które to służą do obliczania odległości genetycznej miedzy sprzężonymi loci. Wyniki również otrzymujemy w tych samych zrozumiałych jednostkach, czyli cM.
          Tu również stosowane są kojarzenia testowe. Analizowane jest tu sprzężenie poprzez śledzenie segregacji genów z dwóch loci. Informacje do analiz dostarczają kojarzenia heterozygot z homozygotami lub też heterozygot o różnych allelach w locus. Inne przypadki nie dostarczają odpowiednich informacji do analizy.
          W pierwszym etapie stosowany jest logarytm ilorazu wiarygodności.


          Obliczenie tego wskaźnika odbywa się dla wcześniej założonego współczynnika rekombinacji "theta" z przedziału od 0 do 0,5. Wielkość "L" to funkcja wiarygodności. Jest to prawdopodobieństwo wystąpienia określonego genotypu, przy wcześniej założonym współczynniku rekombinacji, względem hipotezy o niezależnym dziedziczeniu, czyli "theta" równym 0,5. Wynik LOG determinuje dalsze postępowanie w celu wyciągnięcia wniosków, co do sprzężenie analizowanych loci. Badanie sprzężenia polega na obliczaniu LOG dla kolejnych wartości, r w celu znalezienia tej wartości rekombinacji. W tym celu liczymy LOG dla "theta" = 0,1, 0,2, 0,3, 0,4 lub dla współczynnika rekombinacji bardziej precyzyjnego, np. 0,25. Jeżeli teraz wszystkie uzyskane wartości są mniejsze od -2 to pomiędzy tymi loci nie ma sprzężenia. Jeżeli jednak pojawi się wartość równa lub większa od 3 to jest to dowód, że geny są ze sobą sprzężone właśnie na tym poziomie "theta". Pomiędzy wartościami od -2 do 3 leży przedział wartości niedający jednoznacznej odpowiedzi za względu na zbyt mały materiał do analiz lub zbyt mały stopień sprzędzenia, co oznacza, że należy doświadczenia kontynuować na większej ilości materiału rodzinowego. Jeżeli więc mamy dowody, że loci są sprzężone i znamy częstość rekombinacji to możemy zając się określeniem odległości pomiędzy nimi, dzięki funkcji Kosambiego. Funkcja to ma za zadanie przewidywanie zjawiska interferencji oraz występowanie parzystych jak i nieparzystych crossing-over.