Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 16

STRBase: a short tandem repeat DNA database for the human identity testing


The National Institute of Standards and Technology (NIST) has compiled and
maintained a Short Tandem Repeat DNA Internet Database
( since 1997 commonly referred to
as STRBase. This database is an information resource for the forensic DNA
typing community with details on commonly used short tandem repeat (STR)
DNA markers. STRBase consolidates and organizes the abundant literature
on this subject to facilitate on-going efforts in DNA typing. Observed alleles
and annotated sequence for each STR locus are described along with a
review of STR analysis technologies. Additionally, commercially available STR
multiplex kits are described, published polymerase chain reaction (PCR)
primer sequences are reported, and validation studies conducted by a
number of forensic laboratories are listed. To supplement the technical
information, addresses for scientists and hyperlinks to organizations working
in this area are available, along with the comprehensive reference list of over
1300 publications on STRs used for DNA typing purposes.


Tandemly repeated DNA sequences, which are widespread throughout the

human genome, are polymorphic in nature, making them important genetic
markers for mapping studies, disease diagnosis, and human identity testing
(1). Short tandem repeats (STRs) contain repeat units that are 26 bp in
length and can be readily amplified with the polymerase chain reaction
(PCR). STRs have become popular in forensic laboratories because low
amounts of DNA, even in a degraded form, can be successfully typed.
Sample mixtures can be more readily resolved with STR results than with
previously used DNA typing technologies (2).

In the United States, a core set of 13 STR markers are being used to
generate a nationwide DNA database called the FBI Combined DNA Index
System (CODIS). The CODIS Database and similar DNA databases around the
world have been successful at linking DNA profiles from repeat offenders and
crime scene evidence. STR typing results are also used to aid hundreds of
thousands of paternity testing cases each year.

Forensic DNA testing requires stringent guidelines for DNA sample processing
and data analysis. New STR kits are validated by conducting a number of
tests to verify that results are reliable and robust. A set of quality assurance
standards issued by the DNA Advisory Board must be followed by forensic
laboratories in order to submit STR profiles to the national CODIS database


The primary content of STRBase is shown in Figure 1. The information is

broken into three sections: general, forensic and supplemental information.
An introductory PowerPoint presentation in the STRs 101 section explains
STRs and their use in forensics to help familiarize people with this field.

General information
Information describing each commonly used STR marker forms the core of
STRBase in a format we call STR fact sheets (Fig. 2). These fact sheets are
composed of four sections: general information, PCR primers used, PCR
product sizes and additional information. The general information section
describes other names commonly used for the STR locus, its chromosomal
location, the sequence of the core STR repeat unit, the GenBank accession
number and the number of repeat units in the reference sequence.
Underlined words shown in Figure 2 are hyperlinked to further information.
The second section of these fact sheets, PCR primers used, lists the
sequence for published primers, or the amplification kit(s) in which the
primer set is available for commercial primers (sequences for primers in
commercial kits have not been released at this time) (4). Each primer set is
referenced to the published paper from our reference list or the commercial
source of the kit. Each reference is assigned a number when it is entered into
the database, and is referred to in the Ref. column of Figure 2 (see
Supplemental information). The PCR product section gives the length and
sequence of an amplicon generated using each primer set listed in the PCR
primer section for reported alleles. Each sequence is also referenced to a
published paper in our reference listing. Links are provided to annotated
GenBank sequence information for commonly used STR loci, which include
both repeat and flanking regions with reported primer sequences. The
additional information section lists commercial sources for allelic ladders,
common multiplexes the locus is in and any available population studies of
the locus.

Commercial multiplex STR kits have become widely used by laboratories

worldwide because of their ease of use and high discriminatory power. Charts
showing the allele product size ranges of commercially available multiplex
STR kits, and hyperlinks to vendors are available on STRBase. Information on
published multiplexes not commercially available is also provided. Examples
from two kits are shown in Figure 3. The PowerPlex 16 kit simultaneously
amplifies 15 different STR loci, including the two pentanucleotide repeat loci
Penta D and Penta E, as well as the sex-typing marker amelogenin. A DNA
ladder (ILS-600) labeled with the dye CXR (Promega Corporation, Madison,
WI) is used as an internal sizing standard. The Profiler Plus kit amplifies 9
STRs and amelogenin, and uses ROX (Applied Biosystems, Foster City, CA) to
label its internal sizing standard (GS-500).

Verification of microvariant alleles is becoming very important as STR typing

expands, since they are being observed on a regular basis as more samples
are studied. STRBase provides a publication venue by listing new alleles as
they are found. We invite scientists to submit information on these new and
rare alleles so they may be recognized.

Forensic interest information

The FBI has selected thirteen core loci for the CODIS database, which will be
used for linking serial crimes and unsolved cases with repeat offenders
nationwide. A chromosomal map in STRBase shows the location of each core
locus, with links to STR fact sheets, which are available for all thirteen CODIS
core loci.

NIST ensures exact and compatible measurements by generating, certifying

and issuing Standard Reference Materials (SRMs) to various laboratories.
NIST SRM 2391a is designed for PCR-based testing, and contains genotypes
for 21 STR loci and other common forensic DNA markers. A chromosome
listing is included with information on these markers and restriction fragment
length polymorphism (RFLP) based DNA markers.

STR systems and multiplexes routinely used in human identity testing have
been extensively validated by many groups, as any new system or multiplex
must be in the future. Summaries of published validation studies and the
Scientific Working Group on DNA Analysis Methods (SWGDAM, formerly
TWGDAM) guidelines for validation of PCR-based DNA typing markers are
available on STRBase (5). Researchers can use these summaries to design
their own validation studies and scientists using common STR systems can
review published validation studies.

DNA typing laboratories spend a substantial amount of time and effort

studying allele frequencies for various STR systems and populations. Over
750 published population studies are summarized in STRBase, with a listing
of the population examined, the number of unrelated individuals tested and
the published reference.

Y-chromosome STRs are raising interest in DNA forensics, as they may be

valuable in sexual assault cases, paternity testing or other cases of mixed
male/female DNA. STR fact sheets are available for several Y-chromosome
STRs as well as relevant links, references and a PowerPoint presentation
explaining the use of Y-chromosome STRs for forensic purposes.

Numerous PCR-based sex-typing assays have been reported in the literature.

The most commonly used is amelogenin, which differentiates a 6 bp deletion
on the X-chromosome from the Y-chromosome. Primer sequences, PCR
product sizes and references for amelogenin and three other sex-typing
markers are all listed in STRBase.

Supplemental information
Over 1300 references pertaining to STRs and their application to forensic
DNA typing have been gathered from journals, conference proceedings, book
chapters and other sources. They come from almost 120 sources, and over
800 are from peer-reviewed journals. The abundance of literature available
on the use of STRs for forensic DNA typing shows that it has become an
established technology worthy of being used as court evidence.
The rapid pace of developing technologies for DNA analysis can make it
difficult to keep track of and understand all methodologies. STRBase includes
a brief review of techniques that have been successfully implemented for
resolving and detecting STR alleles. Relevant references and hyperlinks to
groups working in each area are also provided.

STRBase has more than 60 hyperlinks to organizations involved in DNA

typing, commercial sources of instrumentation or DNA testing kits, paternity
testing laboratories, electronic journals where STR publications have been
found and other useful DNA databases.

Addresses for scientists working with STR markers are listed in STRBase with
email links, phone and fax numbers. All scientists working with STR markers
are invited to add their information to aid in cooperation of DNA typing
laboratories around the world.


The short tandem repeat DNA database is available throughout the world
at When using information from
STRBase, please cite this paper and the date which the information was
gathered from STRBase.

The information contained in STRBase is taken from published works on short

tandem repeats used for DNA typing purposes. The literature is regularly
searched for new publications and updates are periodically made.

Certain commercial equipment, instruments or materials are identified in this
report to adequately specify an available source of information. Such
identification does not imply recommendation or endorsement by the
National Institute of Standards and Technology, nor does it imply that the
materials or equipment identified are necessarily the best available for the

Figure 1. Overview of topics covered in STRBase.

Figure 2. An example STR fact sheet for the marker D8S1179.

Figure 3. Schematic representation of the STR loci included in two commercially available
multiplex amplification kits: (A) PowerPlex 16 kit from Promega Corporation and (B) Profiler
Plus kit from Applied Biosystems. The size range for known alleles is represented by the
length of the box containing the locus name. The vertical position of the box reflects the dye
color used to label the amplification products. The two kits shown use three different
fluorescent dyes that are spectrally distinguishable and colored blue, green and yellow for
detection. Different internal sizing standards are available and labeled with a red-colored
dye. Each locus box is hyperlinked to the appropriate STR fact sheet.

1 Edwards,A., Civitello,A., Hammond,H.A. and Caskey,C.T. (
) DNA typing and genetic mapping with trimeric and tetrameric
tandem repeats. Am. J. Hum. Genet., 49, 746756.
2 Sparkes,R., Kimpton,C.P., Watson,S., Oldroyd,N.J., Clayton,T.M.,
Barnett,L., Arnold,J., Thompson,C., Hale,R., Chapman,J. et al. (1996)
The validation of a 7-locus multiplex STR test for use in forensic
casework: (I) Mixtures, ageing, degradation and species studies. Int.
J. Legal Med., 109, 186194.
3 Reeder,D.J. (1999) Impact of DNA typing on standards and practice
in the forensic community. Arch. Pathol. Lab Med., 123, 10631065.

4 Smaglik,P. (2000) Legal protests prompt DNA primer release.

Nature , 406, 366.

5 Technical Working Group on DNA Methods. (1995) Guidelines for a

quality assurance program for DNA analysis. Crime Laboratory
Digest, 22, 1843.

STRBase: Short Tandem Repeat DNA Database yang berulang bagi masyarakat
pengujian identitas manusia
The National Institute of Standards and Technology (NIST) telah menyusun
dan mempertahankan Short Tandem Repeat DNA Database
( Sejak tahun 1997 sering disebut
sebagai STRBase. Database ini merupakan sumber informasi bagi
masyarakat mengetik DNA forensik dengan rincian pada umumnya
digunakan Short Tandem Repeat (STR) DNA. STRBase mengkonsolidasikan
dan mengatur literatur berlimpah pada subjek ini untuk memfasilitasi upaya
yang sedang berjalan dalam mengetik DNA. Urutan alel yang diamati untuk
setiap lokus STR dijelaskan bersama dengan review dari teknologi analisis
STR. Selain itu, tersedia secara komersial kit STR multipleks dijelaskan,
diterbitkan polymerase chain reaction (PCR) urutan primer dilaporkan, dan
studi validasi yang dilakukan oleh sejumlah laboratorium forensik terdaftar.
Untuk melengkapi informasi teknis, alamat bagi para ilmuwan dan hyperlink
ke organisasi yang bekerja di daerah ini yang tersedia, bersama dengan
daftar referensi yang komprehensif lebih dari 1300 publikasi tentang STR
digunakan untuk tujuan DNA mengetik.


urutan STR DNA, yang tersebar luas di seluruh genom manusia, yang
polimorfik di alam, membuat mereka penanda genetik penting untuk studi
pemetaan, diagnosis penyakit, dan pengujian identitas manusia (1). Short
Tandem Repeat (STR) berisi 2-6 bp unit berulang yang panjang dan dapat
segera diperkuat dengan polymerase chain reaction (PCR). STR telah
menjadi populer di laboratorium forensik karena jumlah DNA rendah, bahkan
dalam bentuk terdegradasi, dapat berhasil diketik. campuran sampel dapat
lebih mudah diselesaikan dengan hasil STR daripada dengan DNA mengetik
teknologi yang digunakan sebelumnya (2).
Di Amerika Serikat, satu set inti 13 STR penanda yang digunakan untuk
menghasilkan database DNA nasional yang disebut FBI Gabungan DNA
Indeks System (CODIS). CODIS database dan database DNA yang sama di
seluruh dunia telah berhasil menghubungkan profil DNA dari pelanggar
berulang dan bukti TKP. Hasil mengetik STR juga digunakan untuk membantu
ratusan ribu kasus pengujian ayah setiap tahun.

pengujian DNA forensik membutuhkan pedoman yang ketat untuk DNA

sampel pengolahan dan analisis data. Baru STR kit divalidasi dengan
melakukan sejumlah tes untuk memastikan hasil yang handal dan kuat. Satu
set standar jaminan kualitas yang dikeluarkan oleh Dewan Penasehat DNA
harus diikuti oleh laboratorium forensik untuk mengirimkan profil STR ke
database CODIS nasional (3).


Kandungan utama dari STRBase ditunjukkan pada Gambar 1. Informasi ini

dibagi menjadi tiga bagian: informasi umum, forensik dan tambahan.
Presentasi PowerPoint pengantar dalam 'STR 101' bagian menjelaskan STR
dan penggunaannya dalam forensik untuk membantu membiasakan orang
dengan bidang ini.

Gambar 1. Ikhtisar topik yang dibahas di STRBase.

Informasi Umum
Informasi yang menguraikan setiap umum digunakan STR penanda
membentuk inti dari STRBase dalam format yang kita sebut STR lembar
fakta (Gambar. 2). lembaran ini terdiri dari empat bagian: informasi umum,
primer PCR digunakan, ukuran produk PCR dan informasi tambahan. Bagian
informasi umum menjelaskan nama-nama lain yang biasa digunakan untuk
lokus STR, lokasi kromosom, urutan unit STR ulangi inti, jumlah aksesi Gen
Bank dan jumlah unit berulang dalam urutan referensi. Kata yang
digarisbawahi ditunjukkan pada Gambar 2 hyperlink ke informasi lebih lanjut.
Bagian kedua dari lembar fakta ini, PCR primer yang digunakan, daftar
urutan untuk primer diterbitkan, atau kit amplifikasi (s) di mana primer set
yang tersedia untuk primer komersial (urutan untuk primer dalam kit
komersial belum dirilis saat ini ) (4). Setiap set primer dirujuk ke makalah
yang diterbitkan dari daftar referensi kami atau sumber komersial kit. Setiap
referensi diberikan nomor ketika dimasukkan ke dalam database, dan
disebut dalam 'Ref.' kolom Gambar 2 (lihat informasi tambahan). Bagian
produk PCR memberikan panjang dan urutan dari amplikon yang dihasilkan
menggunakan masing-masing set primer yang tercantum di bagian primer
PCR untuk alel dilaporkan. Setiap urutan juga dirujuk ke sebuah makalah
yang diterbitkan dalam referensi daftar kami. Link yang disediakan untuk
GenBank informasi urutan dijelaskan untuk umum digunakan STR lokus,
yang mencakup berulang dan mengapit daerah dengan urutan primer
dilaporkan. Bagian informasi tambahan diskon sumber komersial untuk
tangga alel, multiplexes umum lokus ini dan setiap studi populasi yang
tersedia dari lokus.
Gambar 2.Contoh STR LI untuk D8S1179 penanda.

Commercial multipleks STR kit telah menjadi banyak digunakan oleh

laboratorium di seluruh dunia karena kemudahan penggunaan dan
kekuasaan diskriminatif yang tinggi. Grafik yang menunjukkan rentang
ukuran produk alel yang tersedia secara komersial STR kit multipleks, dan
hyperlink ke vendor yang tersedia di STRBase. Informasi tentang multiplexes
diterbitkan tidak tersedia secara komersial juga disediakan. Contoh dari dua
kit ditunjukkan pada Gambar 3. PowerPlex '16 kit secara bersamaan
menguatkan 15 lokus STR yang berbeda, termasuk dua pentanucleotide
ulangi lokus Penta D dan Penta E, serta seks mengetik penanda amelogenin.
Sebuah tangga DNA (ILS-600) dilabeli dengan pewarna CXR (Promega
Corporation, Madison, WI) digunakan sebagai ukuran standar internal. The
Profiler Plus kit menguatkan 9 STR dan amelogenin, dan menggunakan ROX
(Applied Biosystems, Foster City, CA) untuk label ukuran internal standar

Gambar 3.Skema representasi dari lokus STR termasuk dalam dua tersedia secara
komersial kit amplifikasi multiplex: (A) PowerPlex '16 kit dari Promega Corporation dan (B)
Profiler Plus kit dari Terapan Biosystems. Rentang ukuran untuk alel diketahui diwakili oleh
panjang kotak berisi nama lokus. Posisi vertikal kotak mencerminkan warna pewarna yang
digunakan untuk label produk amplifikasi. Dua kit ditampilkan menggunakan tiga pewarna
fluorescent yang berbeda yang spektral dibedakan dan berwarna biru, hijau dan kuning
untuk deteksi. Berbeda internal yang standar ukuran yang tersedia dan diberi label dengan
pewarna berwarna merah. Setiap kotak lokus hyperlink ke fakta STR lembar sesuai.

Verifikasi alel microvariant menjadi sangat penting sebagai STR mengetik

mengembang, karena mereka sedang diamati secara teratur karena lebih
banyak sampel yang diteliti. STRBase menyediakan publikasi tempat dengan
daftar alel baru yang ditemukan. Kami mengundang para ilmuwan untuk
mengirimkan informasi tentang ini alel baru dan langka sehingga mereka
dapat diakui.

Informasi kepentingan forensik

FBI telah memilih tiga belas inti lokus untuk database CODIS, yang akan
digunakan untuk menghubungkan kejahatan serial dan kasus yang belum
terpecahkan dengan penjahat kambuhan nasional. Sebuah peta kromosom
pada STRBase menunjukkan lokasi masing-masing lokus inti, dengan link ke
STR lembaran fakta, yang tersedia untuk semua tiga belas CODIS inti lokus.

NIST memastikan pengukuran yang tepat dan kompatibel dengan

menghasilkan, sertifikasi dan menerbitkan Standard Material Referensi
(SRMnya) ke berbagai laboratorium. NIST SRM 2391a dirancang untuk
pengujian berbasis PCR, dan berisi genotipe selama 21 STR lokus dan umum
penanda DNA forensik lainnya. Sebuah kromosom daftar disertakan dengan
informasi tentang ini panjang spidol dan pembatasan fragmen polymorphism
(RFLP) penanda DNA berdasarkan.
sistem STR dan multiplexes rutin digunakan dalam pengujian identitas
manusia telah banyak divalidasi oleh banyak kelompok, karena setiap sistem
baru atau multipleks harus di masa depan. Ringkasan dari studi validasi
diterbitkan dan Kelompok Kerja Ilmiah Metode Analisis DNA '(SWGDAM,
sebelumnya TWGDAM) pedoman untuk validasi penanda DNA mengetik
berbasis PCR tersedia di STRBase (5). Peneliti dapat menggunakan ringkasan
ini untuk merancang studi validasi mereka sendiri dan ilmuwan
menggunakan sistem STR umum dapat meninjau studi validasi diterbitkan.

Laboratorium DNA mengetik menghabiskan banyak waktu dan usaha belajar

frekuensi alel untuk berbagai sistem STR dan populasi. Lebih dari 750 studi
populasi yang diterbitkan dirangkum dalam STRBase, dengan daftar
penduduk diperiksa, jumlah individu yang tidak berhubungan diuji dan
referensi diterbitkan.

STR kromosom Y menaikkan minat forensik DNA, karena mereka mungkin

berharga dalam kasus kekerasan seksual, pengujian paternitas atau kasus
lain dari campuran laki-laki / DNA perempuan. Bahkan STR lembar yang
tersedia untuk beberapa STR kromosom Y serta link yang relevan, referensi
dan presentasi PowerPoint menjelaskan penggunaan STR kromosom Y untuk
tujuan forensik.

Banyak berbasis PCR tes seks mengetik telah dilaporkan dalam literatur.
Yang paling umum digunakan adalah amelogenin, yang membedakan
penghapusan 6 bp pada kromosom X dari Y-kromosom. urutan primer,
ukuran produk PCR dan referensi untuk amelogenin dan tiga penanda seks
mengetik lainnya semua tercantum dalam STRBase.

informasi tambahan
Lebih dari 1300 referensi yang berkaitan dengan STR dan aplikasi mereka
untuk mengetik DNA forensik telah dikumpulkan dari jurnal, prosiding
konferensi, bab buku dan sumber-sumber lainnya. Mereka berasal dari
hampir 120 sumber, dan lebih dari 800 berasal dari jurnal peer-review.
Kelimpahan literatur yang tersedia tentang penggunaan STR untuk mengetik
DNA forensik menunjukkan bahwa telah menjadi teknologi yang didirikan
layak digunakan sebagai bukti pengadilan.

Laju teknologi berkembang untuk analisis DNA dapat membuat sulit untuk
melacak dan memahami semua metodologi. STRBase termasuk review
singkat teknik yang telah berhasil diterapkan untuk menyelesaikan dan
mendeteksi alel STR. referensi yang relevan dan hyperlink ke kelompok kerja
di setiap daerah juga disediakan.

STRBase memiliki lebih dari 60 hyperlink ke organisasi yang terlibat dalam

mengetik DNA, sumber komersial instrumentasi atau tes DNA kit, ayah
pengujian laboratorium, jurnal elektronik di mana publikasi STR telah
ditemukan dan database DNA lainnya yang bermanfaat.

Alamat untuk ilmuwan yang bekerja dengan penanda STR tercantum dalam
STRBase dengan link email, telepon dan nomor fax. Semua ilmuwan yang
bekerja dengan penanda STR diundang untuk menambahkan informasi
mereka untuk membantu dalam kerjasama laboratorium DNA mengetik di
seluruh dunia.


Database tandem pendek berulang DNA tersedia di seluruh dunia

pada Bila menggunakan informasi
dari STRBase, silakan mengutip tulisan ini dan tanggal dimana informasi
dikumpulkan dari STRBase.
Informasi yang terkandung dalam STRBase diambil dari karya yang
diterbitkan pada mengulangi tandem pendek digunakan untuk tujuan DNA
mengetik. literatur secara teratur mencari publikasi baru dan update yang
dibuat secara periodik.


Tertentu komersial peralatan, instrumen atau bahan diidentifikasi dalam

laporan ini memadai menentukan sumber yang tersedia informasi.
Identifikasi tersebut tidak menyiratkan rekomendasi atau dukungan oleh
Institut Nasional Standar dan Teknologi, juga tidak menyiratkan bahwa bahan
atau peralatan diidentifikasi adalah tentu yang terbaik yang tersedia untuk
tujuan tersebut.


You might also like