Môj obľúbený program na identifikáciu baktérií

Autor: Mária Džunková | 15.12.2016 o 15:21 | Karma článku: 5,28 | Prečítané:  513x

V minulých blogoch som písala o rôznych spôsoboch, akými sa môžu identifikovať baktérie na základe ich sekvencie DNA. Dneska vám predstavím môj najobľúbenejší.

Asi najpoužívanejší spôsob na identifikáciu baktérií je ten, kde sa zameriame iba na gén 16S. To som robila aj ja veľakrát v mojich predchádzajúcich výskumoch. Niekedy ide iba o malinké rozdiely niekoľkých písmen A, T, C, G (nukleotidov), ktoré nám prezradia, že jedna sekvencia patrí napríklad baktérií Enterococcus o druhá sekvencia baktérii Vagococcus.

Súčasné DNA sekvenátory vedia bezchybne čítať iba kúsky DNA dlhé niekoľko stoviek nukleotidov, takže sa pri príprave vzorky na sekvenovanie musíme tomu prispôsobiť.

Najjednoduchší spôsob ako sa prispôsobiť schopnostiam sekvenátoru je použiť chemickú reakciu PCR (polymerase chain reaction), ktorá nám namnoží iba z génu 16S niekoľko miliónov krát, ktorý bude dostatočne dlhý na to, aby ho vedel sekvenétor prečítať. Originálna molekula DNA zostane iba v jednej pôvodnej kópií, čo je pri sekvenovaní úplne zanedbateľné. To má dve výhody: budeme mať z každej baktérie namnožený presne ten istý kúsok génu 16S a vlastne všetká DNA vo vzorke, ktorá nepatrila baktériám, bude oproti tomuto génu v úplne zanedbateľnom množstve. Tak môžeme napríklad úplne zabudnúť na ľudskú DNA, ktorá nám často kontaminuje vzorky baktérií z výkalov. Tento spôsob sa volá sekvenovanie amplikonov génu 16S. (Amplikon je namnožený kúsok DNA pomocou reakcie PCR).

Sekvenovanie amplikonov 16S má ale jednu veľkú nevýhodu, a to je slabá rozlišovacia schopnosť. Možno by sme pri sekvenovaní celej dĺžky génu 16S vedeli odlíšiť Enterococcus aVagococcus, ale sekvencia krátkeho amplikonu 16S nám iba povie, žeobidve sekvencie patria zástupcom vyššej taxonomickej jednotky – čeľadeEnterococcaceae. To je informácia, ktorá je pre vedcov veľmi nepresná, pretože čeľaďEnterococcaceae obsahuje veľmi rôznorodé druhy baktérií. To je ako keby sme povedali, že jablká ašípkysú to isté, lebo patriado čeľadeRosaceae.

Vedci, ktorým sa zdáidentifikácia baktérií pomocou amplikonov 16Sveľmi nepresné, sa často rozhodujú pre sekvenovaniekúskov DNA, ktoré pochádzajú z náhodných častí genómov baktérii.Tento spôsob sa volá metagenomika. Genomika je štúdium sekvencie genómu jedného konkrétneho bakteriálneho druhu. Metagenomika je štúdium množstva genómov baktérií zmiešaných dohromady. Vyextrahovaná DNA zo všetkých buniek, ktoré sa nachádzali vo vzorke, sa nakrája na kúsky a dá do sekvenátora. Týmto vedcom nevadí ani vyššia cena sekvenovania a nevadí im ani to, že pri príprave vzorky musia úporne bojovať s odtraňovaním ľudských buniek, ktoré by mohli identifikáciu baktérií zkomplikovať. Lebo jedna ľudská bunka, ktorá sa odlúpla pri stolici z vášho čreva, obsahuje zhruba 1000x viac DNA než jedna bakteriálna bunka. Preto by mohla vlastne zahltiť celú sekvenáciu a namiesto sekvencií vašich baktérii by sme dostali sekvencie vašejvlastnejDNA.

Ak dáme do sekvenátoratieto metagenomické sekvencie,musíme potomv počítačivyhľadať tiekúsky,ktoréobsahujúpráve tiegény, podľa ktorých sa dajú identifikovať bakteriálne druhy. Jeden z týchto génov je už spomínaný 16S, ale moji kolegovia v Austráliivypočítali, že existuje ďalších 120 génov, ktoré môžu slúžiť na identifikáciu baktérií. Niektoré majú lepšiu či horšiu rozlišovaciu schopnosť, ale dôležité je, že sa nachádzajú v genómoch baktérií iba v jednej kópií a že ich obsahuje každý jeden druh baktérie. Teda ak budeme analyzovať všetkých 120 génov naraz, budeme mať oveľa lepšie rozlíšenie ako keď sa pozeráme iba na krátku časť génu 16S.

Moji austrálski kolegoviavymysleli jeden programzvaný GraftM, ktorýv metagenomických sekvenciáchvyhľadávatýchto 120 génov (alebo hociktoré z nich podľa vášho výberu, napríklad iba 16S). Výhoda je v tom, že neporovnáva poradie písmen ako to robí väčšina programov (pairwise sequence comparisons), ale tieto sekvencie sa snaží začleniť do takzvaného stromu života. To je už trochu komplikovanejší algoritmus, ale je veľmi presný. Dostaneme nakoniec veľmi presný profil zloženia baktérií, ktoré sa nachádzajú v našej vzorke.

Škoda, že som tento program som objavila až teraz, odkedy pracujem v Austrálii. Som z neho úplne nadšená. Predtým som používala buď iba sekvenovanie amplikonov 16S, alebo keď som aj mala nejaké metagenomické sekvencie, tak som používala vyhľadávače založené na pairwise sequence comparison. Najväčšia výhoda GraftM je v tom, že analyzuje viac génov naraz a že ich zaraďuje do stromu života. Je to unikátny program, ktorý pozná málokto a určite si zaslúži miesto na mojom blogu.

Ešte na záver ukážka, ako vyzerá taký "strom života". Tento je z roku 2016, bol publikovaný v Nature Microbiology. Možno niekedy nabudúce vysvetlím, ako sa takéto stromy robia, lebo je na to niekoľko metód a nie sú vôbec jednoduché.

 

Páčil sa Vám tento článok? Pridajte si blogera medzi obľúbených a my Vám pošleme email keď napíše ďalší článok
Pridaj k obľúbeným

Hlavné správy

ŠPORT

Valach: Ak Petrovi niekto nepomáha a potom ho prešprintuje, divák to vidí

Dva roky za sebou priviedol Ján Valach ako tréner mužskej reprezentácie Petra Sagana k titulu majstra sveta.

DOMOV

Na smrti trojročného chlapca má podiel nemocnica, zle ho liečila

Úrad zistil, že nitrianska nemocnica v liečbe chlapca pochybila.


Už ste čítali?