Welcome to Scribd!

LAB 1 - Text Search

Uploaded by

0% found this document useful (0 votes)

18 views13 pages

This document discusses online DNA and protein sequence databases. It describes several major databases, including GenBank, EMBL, and DDBJ for DNA sequences, and SWISS-PROT and trEMBL for protein sequences. These databases vary in their level of annotation and redundancy. The document also notes problems with automatic annotation of new sequences and increasing uncertainty about functional annotation in some databases.

Original Description:

lab 1

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

18 views13 pages

LAB 1 - Text Search

Uploaded by

nhi

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 13

Search inside document

LAB 1 - TEXT SEARCH FROM ONLINE

DATABASES
Online database interface
 To become familiar with the set up of online database
interface
 Know how to search for a program with a sequence
 Know how to work through protocols
Sequence database browsing and text
searching
DNA databases
 GenBank: located at the National Centre for Biotechnology
Information (1980s)
 EMBL (European Molecular Biology Laboratory): located at
European Bioinformatic Institute
 DDBJ (DNA Data Bank of Japan): located at the National
Institute of Genetics (1986)
Sequence database browsing and text
searching
Annotated sequence databases
 Additional information about sequence, definition, exon
location, associated protein etc.
 EMBL, GenBank, SWISS-PROT etc.
Low-annotation sequence databases
 Basic information only
 EST databases, high-throughput genome sequences
 Sequence comparison searching only
Sequence database browsing and text
searching
GenBank subset databases
 EST – sequences of cDNA which have been reverse-transcribed
from mRNA
 STS – short DNA segments with a single location in the
genome
 HTG – ‘unfinished’ DNA sequences generated by the high-
throughput sequence centers
 GSS – similar in nature to ESTs, except that the sequences are
genomic in origin, rather than cDNA
Sequence database browsing and text
searching
Non-redundant (NR)
 NR databases are created from multiple databases
 Contain sequence data only
 Cannot be text searched
 Can be search using a sequence
 Databases combine sequences from more than one database
 Ensure that there is one of every sequence in the database
 Reduce missing entries
 Text information is not combined and is lost
GenBank format: Header
Length Type Submission

Unique
identifier

Reference
GenBank format: Features
GenBank format: Sequence
Sequence database browsing and text
searching
Protein databases
 GenPep
 GenBank sequences that are translated exons in GenBank –
peptide GenPep
 trEMBL & SWISS-PROT
 Swiss Bioinformatic Institute (1998)
 Contains translations of all coding sequences in EMBL
 SP-trEMBL contains entries that will eventually be incorporated
into SWISS-PROT but have not been manually annotated
Sequence database browsing and text
searching
 trEMBL & SWISS-PROT (cont.)
 REM-trEMBL contains sequences that are not destined to be included
in SWISS-PROT e.g. fragments of fewer than eight amino acids,
synthetic sequences, patented sequences
 High level annotation including
 Descriptions of the function of the protein
 Structure of the domains
 Post translation modification
 All variants
 Aims to be minimally redundant
 SP-trEMBL is effectively a preliminary section of SWISS-PROT
 Entries in SP-trEMBL are removed when they are incorporated into
the SWISS-PROT database
Sequence database browsing and text
searching
Problems with the databases
 The bulk of proteins in GenBank have had their functional
annotation assigned by automatic methods, the quality and
reliability of this information in increasingly doubtful
Sequence database browsing and text
searching
Problems with the databases
 Majority of new DNA sequence information is annotated
automatically.
 Genes are found in genomic DNA by automatic open reading frames
(ORF) detection algorithms and automatically annotated based on
similarity searches againts the proteins in the databases
 These automatic annotation have proved to be rather powerful in the
case of microbial genomes
 In eukaryotic genomes there are complexities that cannot be easily
overcome by simple algorithms. It requires careful scrutiny to
distinguish between a pseudogene and a member of a multi-gene
family. Transposons and many other types of repeated sequences
occur both within expressed coding sequences and in non-coding
sequences

This Study Resource Was: Polymerase Chain Reaction
Document4 pages
This Study Resource Was: Polymerase Chain Reaction
Dank Movies
No ratings yet
MCQs in Clinical Biochemistry
Document15 pages
MCQs in Clinical Biochemistry
sidharta_chatterjee
80% (15)
Bioinformatics Tools: Stuart M. Brown, PH.D Dept of Cell Biology NYU School of Medicine
Document50 pages
Bioinformatics Tools: Stuart M. Brown, PH.D Dept of Cell Biology NYU School of Medicine
Vivek Chandel
No ratings yet
Bio Final
Document8 pages
Bio Final
Chris Smith
No ratings yet
Next Generation Sequencing (NGS) - FAQS
Document9 pages
Next Generation Sequencing (NGS) - FAQS
hesham12345
No ratings yet
GlOsario Bioinformatica
Document5 pages
GlOsario Bioinformatica
cristianojpp
No ratings yet
Molecular Genetics - Lab Manual - 22 May 2021
Document36 pages
Molecular Genetics - Lab Manual - 22 May 2021
minghouu215
No ratings yet
Same Nva Tting
Document22 pages
Same Nva Tting
Axelle Dupon
No ratings yet
Adv Bi Unit 1
Document39 pages
Adv Bi Unit 1
Neha Paddillaya
No ratings yet
2c.ProteinSequenceDatabase (Bioinfo)
Document84 pages
2c.ProteinSequenceDatabase (Bioinfo)
Quicker Quick
No ratings yet
Bioinformatics Databases
Document10 pages
Bioinformatics Databases
Varshika Singh
No ratings yet
Database Dalam Bioinformatika
Document34 pages
Database Dalam Bioinformatika
Alda Ciptaningrum
No ratings yet
Ncbi
Document25 pages
Ncbi
Pakistan Zindaabda
No ratings yet
Analytical Methods in Molecular Biology: Tutorial #1 - Gene
Document23 pages
Analytical Methods in Molecular Biology: Tutorial #1 - Gene
Michael Ferno
No ratings yet
Biological Database 1
Document50 pages
Biological Database 1
Muhammad uzair
No ratings yet
Bioinformatics Database and Applications
Document82 pages
Bioinformatics Database and Applications
Rekha Singh
100% (2)
EST - "Expressed Sequence Tags": - Manali Mehendale
Document19 pages
EST - "Expressed Sequence Tags": - Manali Mehendale
Anand Dangre
No ratings yet
Data Retrieval
Document17 pages
Data Retrieval
Ayesha Khan
50% (2)
6.1 Bioinformatics Databases and Tools - Introduction: Lecture 6: December, 28, 2001
Document31 pages
6.1 Bioinformatics Databases and Tools - Introduction: Lecture 6: December, 28, 2001
aditya.2352700
No ratings yet
Unit 2
Document103 pages
Unit 2
Suraj Verma
No ratings yet
Ing Gen P4
Document66 pages
Ing Gen P4
Bruno Geanpiero Díaz Cruz
No ratings yet
Annotating Genomes Using Proteomics Data: Andy Jones Department of Preclinical Veterinary Science
Document22 pages
Annotating Genomes Using Proteomics Data: Andy Jones Department of Preclinical Veterinary Science
Shaher Bano Mirza
No ratings yet
Online Biological Databases: A/Prof. Ly Le
Document64 pages
Online Biological Databases: A/Prof. Ly Le
LinhNguye
No ratings yet
Expressed Sequence Tags
Document20 pages
Expressed Sequence Tags
sunifeb128075
0% (1)
Bioinformatics Day3
Document4 pages
Bioinformatics Day3
Aby Mathew
No ratings yet
Availability of Nucleotide and Protein Database On Internet: Course Name: Bioinformatics-2
Document3 pages
Availability of Nucleotide and Protein Database On Internet: Course Name: Bioinformatics-2
roma
No ratings yet
Genome Annotation
Document24 pages
Genome Annotation
thammmisetti pavankumar
No ratings yet
BIF401 MID Term Exam 2022 Preparation by BADSHA ALI
Document6 pages
BIF401 MID Term Exam 2022 Preparation by BADSHA ALI
Gum Naam Singer
No ratings yet
Mulder 2007
Document13 pages
Mulder 2007
Caroline Christine
No ratings yet
NT Seq Database
Document4 pages
NT Seq Database
Devinder Kaur
No ratings yet
Bio PPT
Document35 pages
Bio PPT
shah_jalpan92911
No ratings yet
Capture d’écran . 2023-03-14 à 00.15.22
Document54 pages
Capture d’écran . 2023-03-14 à 00.15.22
chloejanin65
No ratings yet
Coursera 14b Unit 1-Ncbi PDF
Document5 pages
Coursera 14b Unit 1-Ncbi PDF
schwarthraul
No ratings yet
1 What Is Bioinformatics
Document34 pages
1 What Is Bioinformatics
Laxmikant Kamble
No ratings yet
Bioinformatics Lab 1
Document4 pages
Bioinformatics Lab 1
Fiqa Success
0% (1)
Lecture 5 Information Retrieval From Databases
Document22 pages
Lecture 5 Information Retrieval From Databases
Veer khade
No ratings yet
11.bioinformatics Analysis of Proteins
Document49 pages
11.bioinformatics Analysis of Proteins
Alexis Jenatzy
No ratings yet
Bioinformatics: ABE 2007 Kent Koster Group 3
Document43 pages
Bioinformatics: ABE 2007 Kent Koster Group 3
BUNDATIE
No ratings yet
Gene Expression RNA Sequence
Document120 pages
Gene Expression RNA Sequence
Mutsawashe Munetsi
No ratings yet
BI Manual
Document35 pages
BI Manual
Fazila
No ratings yet
Lecture 2
Document28 pages
Lecture 2
Salix Matt
No ratings yet
Biological Database
Document19 pages
Biological Database
Mahesh Yadav
100% (8)
Accessing Bibliographic Databases
Document25 pages
Accessing Bibliographic Databases
Nischith Rk
No ratings yet
Sequence Retrieval System
Document2 pages
Sequence Retrieval System
Ayesha Khan
No ratings yet
Protein Sequence Database Ankita Sharma
Document31 pages
Protein Sequence Database Ankita Sharma
Shivam vishwakarma
No ratings yet
Gene Prediction
Document15 pages
Gene Prediction
Raghav Suresh
No ratings yet
Fasta and Blast
Document2 pages
Fasta and Blast
Srirang Gaddamwar
No ratings yet
The EMBL Nucleotide Sequence Database
Document5 pages
The EMBL Nucleotide Sequence Database
Jorge Luis Parra
No ratings yet
Lec 3 Terms and Definitions in Bioinformatics
Document8 pages
Lec 3 Terms and Definitions in Bioinformatics
hamza.khurshid.989
No ratings yet
Chapter 18 Presentation
Document47 pages
Chapter 18 Presentation
Neal
No ratings yet
Practical 2 - Ncbi
Document3 pages
Practical 2 - Ncbi
hraj92206
No ratings yet
Application in Establishing Epidemiology and Variability: Genome & Protein " Sequence Analysis Programs"
Document23 pages
Application in Establishing Epidemiology and Variability: Genome & Protein " Sequence Analysis Programs"
Dr. Rajesh Kumar
100% (3)
BIF401 Midterm Past Papers Subjective
Document10 pages
BIF401 Midterm Past Papers Subjective
kabsha.raajpoot
No ratings yet
Genome Annotation
Document25 pages
Genome Annotation
Sajjad Hossain Shuvo
No ratings yet
Bs982 l08 Basic Blast
Document38 pages
Bs982 l08 Basic Blast
Narges Miri
No ratings yet
BIOINFORMATICS
Document7 pages
BIOINFORMATICS
RICA MAE LUMICTIN
No ratings yet
8024 Bio Info
Document28 pages
8024 Bio Info
simha082
No ratings yet
Bioinformatics by MHN
Document15 pages
Bioinformatics by MHN
Muhammad Mubeen Gaho
No ratings yet
I Hate This Website
Document4 pages
I Hate This Website
I HATE SCRIBD
No ratings yet
Jiya Khasdeo Presents The Power Point Presentation On
Document16 pages
Jiya Khasdeo Presents The Power Point Presentation On
Harshit Raut
No ratings yet
Lecture 5 Protein Sequence Database
Document12 pages
Lecture 5 Protein Sequence Database
Bhawna Rathi
No ratings yet
Introduction to Bioinformatics, Sequence and Genome Analysis
From Everand
Introduction to Bioinformatics, Sequence and Genome Analysis
Jerry H. Swift
No ratings yet
Introduction to Bioinformatics Using Action Labs
From Everand
Introduction to Bioinformatics Using Action Labs
Jean-Louis Lassez
No ratings yet
Hsslive-xi-botany-RESPIRATION IN PLANTS-8
Document7 pages
Hsslive-xi-botany-RESPIRATION IN PLANTS-8
diyakozhimala
No ratings yet
Jurnal Kajian Interaksi Zat Besi Dengan Zat Gizi
Document6 pages
Jurnal Kajian Interaksi Zat Besi Dengan Zat Gizi
herry gizi
No ratings yet
Pricelist Desember 2021
Document71 pages
Pricelist Desember 2021
JAJANG JAPAR
No ratings yet
Macro Nutrients
Document6 pages
Macro Nutrients
Tian He
No ratings yet
Asam Nukleat
Document41 pages
Asam Nukleat
Yoona Naana
No ratings yet
BIOC310 Medical Biochemistry
Document5 pages
BIOC310 Medical Biochemistry
adeeb ahmed
No ratings yet
Teknik Reaksi
Document21 pages
Teknik Reaksi
Ahmadi Fachry
No ratings yet
Megan A Emmanuel Photobiocatalytic Strategies For Compressed
Document62 pages
Megan A Emmanuel Photobiocatalytic Strategies For Compressed
ARMANDO JOSE MORENO CRUZ
No ratings yet
Biomolecules (DPP-9) - Compressed
Document25 pages
Biomolecules (DPP-9) - Compressed
ALI ASHRAF
No ratings yet
AP+Bio 048+Enzymes+Worksheet WL
Document3 pages
AP+Bio 048+Enzymes+Worksheet WL
Patricia Andrea Alexei Fernandez
No ratings yet
Human Biology: Unit Paper
Document24 pages
Human Biology: Unit Paper
adel hany
No ratings yet
Materi Kuliah Vitamin
Document14 pages
Materi Kuliah Vitamin
Feni
No ratings yet
CHP 1 - Basic Elements in Life
Document14 pages
CHP 1 - Basic Elements in Life
Shaaru Tharshini
No ratings yet
Biochemistry - Aminoacids
Document21 pages
Biochemistry - Aminoacids
Balakrishnan Rengesh
No ratings yet
Key Hormones Brain Metabceu2018
Document8 pages
Key Hormones Brain Metabceu2018
Kim Ramos
No ratings yet
Biology 101
Document72 pages
Biology 101
Omar Sawas
100% (1)
Lea Animal Nutrition Mdgacutan Vsu 2017
Document128 pages
Lea Animal Nutrition Mdgacutan Vsu 2017
Mac Dwayne Carpeso
No ratings yet
The Polymerase Chain Reaction
Document35 pages
The Polymerase Chain Reaction
Athika Darumas Putri
No ratings yet
Review DNA Mitokondria
Document2 pages
Review DNA Mitokondria
Mir Rim
No ratings yet
2 Molecular Biology
Document25 pages
2 Molecular Biology
Marisa Kruppa
No ratings yet
Formal Rep 1
Document6 pages
Formal Rep 1
PATRICIA RAE ENDAYA
No ratings yet
Bio Inorganic Chemistry
Document106 pages
Bio Inorganic Chemistry
Umendra Kumar Khokhar
No ratings yet
Nucleic Acids Structure and Replication QP
Document11 pages
Nucleic Acids Structure and Replication QP
Jannat Itakhunov
No ratings yet
Biology Lab Report 2
Document6 pages
Biology Lab Report 2
Quynh Dang Phuong
No ratings yet
csb0001011 Full PDF
Document30 pages
csb0001011 Full PDF
Nate Alvey
No ratings yet
PER. 5 Enzymes in Genetics Engineering - 2
Document38 pages
PER. 5 Enzymes in Genetics Engineering - 2
sri wahyuni
No ratings yet