Download as pdf or txt
Download as pdf or txt
You are on page 1of 2

PartA.

請利用 “Data exploration with awk” tutorial 裡面的資料中,回答下列題目


(共 30 分)

1. 在 orders.tsv 的檔案中,出現 "Chicken Bowl" 的資料有幾行? (5 分)


A.726
2. 在 orders.tsv 的檔案中,若以 tab 分隔,可以分成幾個欄位 (5 分)
A.50 個
3. 在 orders.tsv 的檔案中,若以空格分隔,第一筆購買資料可以分成幾個欄位 (5 分)
A.20 個
4. 在 orders.tsv 的檔案中,第三欄 item_name 購買"Chicken Bowl"的紀錄中,第二
欄位(購買數量),加總是多少? (5 分)
A.11
5. 在 orders.tsv 的檔案中,第三欄 item_name 購買"Canned Soda"的紀錄中,其第
二欄位(購買數量),加總是多少? (5 分)
A.14
6.在 orders.tsv 的檔案中,有幾筆資料其第二欄位購買數量>2? (5 分)
A. 36 筆
PartB. 在 DNA sequencing QC 的 tutorial 中, 回答下列題目 (共 40 分)
1. 在 fastp 之前,"Read2" 有多少 reads? Read2 有多少 base? 其 Q30 的 base 有
多少?
(1) 25000 個
(2) 3775000 base
(3) Q30:3345619 base
(5 分; 5 分; 5 分)
2. 以不修改參數的預設值 fastp QC 過濾後,"Read2" 有多少 reads? Read2 有多少
base? 其 Q30 的 base 有多少?
(1) 24455 個 reads
(2) 3657406 base
(3) Q30:3274601 base
(5 分; 5 分; 5 分)
3. 如果只是要快速看一下結果,只取 10,000 reads 跑 fastp, 其結果 Duplication rate
是多少? (5 分)
A.1.21634%
4. 如果想丟棄短於 100 bp 長度的 reads, 其結果 reads failed due to too short 是多
少? (5 分)
A.618
PartC. 以 sequence alignment with BLAST 的 tutorial 中,回答下列題目 (共 30
分)
1. p450s.fasta 有幾條序列? 是蛋白質還是核苷酸序列? (5 分; 5 分)
(1) 1290 條
(2) 蛋白質序列
2. 以 orf_trans 當作資料庫(database),p450s.fasta 中序列
sp|Q92148|CP1A1_MICTO 與資料庫中的哪個序列最像? 蛋白質相似度為多少?
alignment 長度為多少?
(5 分; 5 分; 5 分)
3. 若 query 是核苷酸序列, 要比對到的 database(subject)是蛋白質序列, 要使用
BLAST+ suite 的哪個工具? (5 分)
A.可以用 blastx 。blastx 會將核苷酸序列轉譯成蛋白質序列,然後與資料庫比對。

You might also like