Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 8

Prirodoslovna škola Vladimira Preloga

Genetske baze podataka

Prof: Mirela Zenko Ivić

Ivan Gotesman, 4.s

Zagreb, 13.12.2020
Sadržaj
Uvod……………………………………………………………………………………….….2

Razrada……………………………………………………………………………………..3-5

Zaključak……...………………………………………………………………………………6

Literatura………………………………………………………………………………………7
Uvod
Genetska baza podataka je jedan ili više skupova genetičkih podataka (geni, genski
proizvodi, varijante, fenotipovi) pohranjeni zajedno sa softverom kako bi se
korisnicima omogućilo preuzimanje genetskih podataka, dodavanje genetskih
podataka i izvlačenje informacija iz baze podataka. Genetske baze podataka su
spremišta organiziranih podataka koji su resurs za razumijevanje funkcioniranja
organizama.

Genetske baze podataka sada pomažu u rasvjetljavanju genske funkcije, procjenjuju


kretanje gena u populacijama, razlikuju podtipove bolesti, prate kako geni mogu
predisponirati ili zaštititi od bolesti i poboljšavaju medicinsku intervenciju. To postižu
spajanjem nekoliko tokova podataka o pojedincima: molekularno genetski podaci;
visokokvalitetni standardizirani klinički podaci; podaci o zdravlju, načinu života i
okolišu; a u nekim slučajevima i genealoški podaci.
Razrada
Podjela baza podataka

Biološke baze podataka razvijaju se u različite svrhe, obuhvaćaju različite vrste


podataka s heterogenom pokrivenošću i raspoređuju se na različitim razinama
različitim metodama, tako da postoji nekoliko različitih kriterija koji se primjenjuju na
klasifikaciju baza podataka.

Opseg pokrivenosti podacima

Prema opsegu pokrivenosti podacima, biološke baze podataka mogu se klasificirati


kao sveobuhvatne i specijalizirane baze podataka. Sveobuhvatne baze podataka
pokrivaju različite tipove podataka o brojnim vrstama, a tipični su primjeri GenBank,
Europski laboratorij za molekularnu biologiju (European Molecular Biology
Laboratory, EMBL) i Japanska banka podataka o DNK (DNA Data Bank of Japan,
DDBJ). Te su tri baze podataka osnovane kao Međunarodna suradnja baza
podataka o nukleotidnim sekvencama 1988. godine za prikupljanje i širenje sljedova
DNK i RNK. S druge strane, specijalizirane baze podataka sadrže određene vrste
podataka ili podataka određenih organizama. Na primjer, WormBase je za biologiju i
genomiku nematoda, a RiceWiki za kuraciju gena riže u zajednici.

Razina biokuracije

Prema razini kuracije podataka, biološke baze podataka mogu približno spadati u
primarne i sekundarne ili izvedene baze podataka. Primarne baze podataka sadrže
sirove podatke kao arhivsko spremište kao što je NCBI Sequence Read Archive
(SRA), dok sekundarne ili izvedene baze podataka sadrže kurirane informacije kao
dodanu vrijednost, npr. NCBI RefSeq.

Metoda biokuracije

Kao posljedica eksplozivnog rasta podataka, kuracija sve više zahtijeva kolektivnu
inteligenciju za zajedničku integraciju i anotaciju podataka. Stoga se biološke baze
podataka također mogu klasificirati kao baze podataka koje stručnjaci kuriraju, npr.
RefSeq i TAIR i baze podataka koje uređuju zajednice, a koje brojni istraživači, na
primjer, LncRNAWiki i GeneWiki, uređuju na zajednički i suradnički način.

Vrsta podataka kojima se upravlja

Prema vrstama podataka kojima se upravlja u različitim bazama podataka, biološke


baze podataka mogu približno spadati u sljedeće kategorije: (1) DNA, (2) RNA, (3)
protein, (4) ekspresija, (5) put, (6) bolest , (7) nomenklatura, (8) literatura i (9)
standard i ontologija.
Baze podataka povezane s ljudima

Dekodiranje ljudskog genoma ima veliko značenje u, s teoretskog gledišta, otkrivanju


ljudske evolucijske povijesti, a iz praktičnog, u istraživanju osobne medicine protiv
različitih bolesti. Uzimajući u obzir heterogenost u vrsti podataka, opsegu i kuraciji,
biološke baze podataka mogu se klasificirati u više kategorija pod različitim kriterijima
kao što je gore prikazano, što ljudima olakšava učinkovitu karakterizaciju baza
podataka i identificiranje baza podataka od interesa. Međutim, neke baze podataka s
vremenom su nedostupne ili se loše održavaju / ažuriraju ili čak nikad ne koriste.
Kako je klasifikacija baze podataka na temelju vrste podataka informativna i
jednostavna, svakoj se bazi dodjeljuje jedna glavna kategorija, iako jedna baza
podataka može imati više kategorija. U nastavku će fokus biti na baze podataka
kategorizirane u DNK, RNK i proteine.

DNK baze podataka

Baza podataka DNK usmjerena je na upravljanje podacima DNK mnogih ili nekih
određenih vrsta. Primarna funkcija ljudskih DNK baza podataka uključuje
uspostavljanje referentnog genoma (npr. RefSeq), profiliranje ljudskih genetskih
varijacija (npr. DbSNP), povezanost genotipa s fenotipom (npr. EGA) i identifikaciju
metagenoma mikrobioma čovjeka (npr. , IMG / HMP). Reprezentativni primjer baze
podataka DNK je GenBank, zbirka svih javno dostupnih DNK sekvenci. Od svog
osnutka 1982. GenBank raste izvanrednim tempom i od prosinca 2014. sadrži preko
184 milijarde nukleotidnih baza u više od 179 milijuna sekvenci.

RNK baze podataka

Kako se samo mali dio ljudskog genoma transkribira u mRNK, velika se količina
transkribira u nekodirajuće RNK (ncRNA i lncRNA). Stoga su izgrađene sve veće
baze podataka o ljudskoj RNK za dešifriranje ncRNK (npr. GENCODE), a također i
za lncRNK (npr. lncRNAWiki). Reprezentativni primjer baze podataka RNK je
„RNAcentral“, ona pruža jedinstveni pristup podacima o sekvenci podataka ncRNK i
lncRNK.

Baze podataka o proteinima

Svrha izrade baza podataka o proteinima uključuje prikupljanje univerzalnih proteina


(npr. UniProt), identifikaciju proteinskih porodica i domena (npr. Pfam), rekonstrukciju
filogenetskih stabala (npr. TreeFam) i profiliranje proteinskih struktura (npr. PDB).
Reprezentativni primjer baze podataka o proteinima je „PDB“, glavna primarna baza
podataka za 3D strukture bioloških makromolekula utvrđenih rentgenskom
kristalografijom. Osnovan je 1971. godine i sadrži 105.465 bioloških
makromolekularnih struktura od 30. prosinca 2014., od kojih 27.393 zapisa pripadaju
ljudskim.
Iskoristivost baza podataka

Baze podataka se mogu koristiti u kaznenim djelima u kojima nema svjedoka.


Čovjekov DNK može služiti kao dokaz da je osumnjičeni bio na mjestu zločina, u tom
slučaju se koristi DNK baza podataka, a ako ima podudaranosti u DNK dokazi protiv
optuženika su još jači. To dakle može služiti za smanjenje stope kriminala. U
izvještaju koji su podnijeli „Forbes“ i „Quora“, Jennifer Doleac i suradnici, dokazuje da
DNK profiliranje smanjuje stopu zločina za 17%. Baze podataka se razvijanjem
tehnologije povećavaju i države međusobno dijele određene podatke kada je to
potrebno, najčešće je to između međunarodnih institucija za sprječavanje zločina.
Dakako informacije iz genetičkih baza podataka mogu se koristiti za genetske studije,
za daljnje sprečavanje bolesti, bolje shvaćanje same DNK…

Navedene stvari vezane za genetske baze mogu uvelike pomoći ljudima u


budućnosti, to može predstavljati problem jer podatci koji spremaju u baze podataka
tamo ostaju zauvijek, što može dovesti do velikih problema poput curenja informacija,
krađe identiteta… Iako se tehnologija jako razvila DNK profiliranje ne može biti 100%
sigurno i točno. Tvrdi se da je točnost 99,9%, ali to znači da postoji mogućnost
pogreške od0,1%. Naime, Terri Gossard je objavila kako je predala uzorak DNK u
dvije različite baze podataka i dobila razliku od 8 postotnih bodova u svom
Britanskom i Iranskom podrijetlu.
Zaključak
Genetske baze podataka su se razvijale proporcionalno s razvitkom tehnologije, a
njihov bi rast mogao ključan za daljnji razvitak ljudskog roda. Iako se njihova svrha
danas ne razlikuje previše od one primarne, a to je razumijevanje funkcioniranja
organizama, genetske baze podataka danas imaju puno veću iskoristivost.
Razvijanjem modernije tehnologije baze podataka uvelike su pomogle u forenzici,
kriminalnim djelima, traženju rodbina, podrijetla i sl. Takve ogromne baze podataka
predstavljaju samim time veliku odgovornost u korištenju za privatne ili javne svrhe.
Problemi curenja podataka jedan je od glavnih nedostataka koje ove velike baze
podataka mogu imati. Tu je dakako i pitanje etičnosti koje bi se trebalo razriješiti, a
postavlja se kada se podaci u genetskim bazama žele iz mnogih razloga(npr.
kriminalnih ili znanstvenih istraživanja) zadržati zauvijek.
Izvori

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4411498/#b0010 – NCBI,
Biological Databases for Human Research

https://www.gov.uk/government/publications/use-of-genetic-genealogy-
techniques-to-assist-with-solving-crimes/should-we-be-making-use-of-
genetic-genealogy-to-assist-in-solving-crime-a-report-on-the-feasibility-
of-such-methods-in-the-uk-accessible-version – GOV.UK ,Research and
analysis

Should we be making use of genetic genealogy to assist in solving crime? A report


on the feasibility of such methods in the UK (accessible version)

https://www.sciencedirect.com/topics/medicine-and-dentistry/dna-
database -Science Direct, DNA database
https://vittana.org/11-significant-dna-database-pros-and-cons - ittana; Personal
Finance Blog

You might also like