Download as pdf or txt
Download as pdf or txt
You are on page 1of 5

ARAGORN Long Audio Project

*หากพบเนือหาทีไม่ตรงกับ Guideline หรือไฟล์อน


ื ให ้ถือว่า ไฟล์ FAQ คือ อัปเดตล่าสุดเสมอ*

FAQ_สรุปคําถามคําตอบทีพบบ่อย V7 (as of 11 Mar 2022) add 29_

คําถามทีพบบ่อย คําตอบ
1) Invalid Task คืออะไร งานโปรเจกต์ ARAGORN Long Audio คืองานถอดความเสียงภาษาไทย ทีเป็ นการคุยโทรศัพท์ของคนสองคน
โดยแยกเป็ นเสียงผู ้พูดคนแรก เรียกว่า Item1 และเสียงผู ้พูดคนทีสอง เรียกว่า Item 2

 ถ ้า Item 1 และ Item 2 พูดภาษาไทย คุณภาพงานเสียงดี และถอดความได ้ ก็ Valid task และเริมถอด


ความได ้
 ถ ้า Item 1 พูดภาษาไทย คุณภาพงานเสียงดี และถอดความได ้ แต่ Item 2 เป็ นเสียงภาษาต่างชาติที
ไม่ใช่ภาษาไทย หรือคุณภาพงานเสียงแย่มาก ก็จะทําให ้ทังงานเป็ น “Invalid task” และไม่ต ้องถอด
ความ
 ถ ้า Item 1 หรือ Item 2 เป็ น Invalid ก็จะทําให ้ทังงานเป็ น “Invalid task” และไม่ต ้องถอดความ

หมายเหตุ หากเป็ นงานเสียงภาษาไทยแต่เป็ นสําเนียงท ้องถินเช่น ภาษาอีสาน ภาษาเหนือ เกิน 30% ของงาน
เสียงทังหมด ให ้ถือว่าทังงานเป็ น “Invalid task” และไม่ต ้องถอดความ แก้ไขไปที faq26
2) Invalid Clip คืออะไร คืองานทีไม่ต ้องถอดความ และต ้องมีชว่ งเวลาตังแต่ 1s. ขึนไป โดยไม่จํากัดความยาวของเวลาของ Invalid clip
อาจจะมีความยาวเป็ นนาทีเลยก็ได ้

งาน Invalid clip ได ้แก่ ช่วงเงียบระหว่าง Valid clip / เสียงหัวเราะ เป็ นต ้น


3) Valid hour หรือเวลาที เวลาทีนับผลงานของเราคือ “Valid hours” ทีสะสมมาจาก valid seconds ของ “valid audio” ในแต่ละ audio
นับผลงานคืออะไร ทีเราส่งงาน “complete” ไปที QA และ QA ส่ง “accept” ไปจนถึงลูกค ้าตรวจผ่านอนุมัต ิ
รายได ้ คือ 27 usd per valid hour.
หมายเหตุ แนะนํ าว่า ให ้บันทึกหมายเลขงาน ID ไว ้ เพือนับผลงานตนเองไว ้ และเพืออ ้างอิงในการ rework/
recall งานกับเมืองนอก โดยคร่าวๆ คืองาน 1 ID = 15 valid minutes

หากท่านมีคําถามเรืองรายได ้ หรือ system issues (ถ ้าติดขัดเรืองระบบให ้ capture screenshot แล ้วถามหรือ


แนะนํ า) ให ้ท่านติดต่อทางเมืองนอกโดยตรงเป็ นภาษาอังกฤษ เวลาทําการปกติคอ ื จันทร์-ศุกร์ 8-17น. เวลาไทย
นอกนันอาจต ้องทิงคําถามไว ้ในแชทและรอให ้เขามาตอบค่ะ โดยงานนีมี PA (Project admin. = @Wendy)
4) Valid Clip คืออะไร เมือท่านเปิ ดงานใหม่ ท่านจะเห็น 1 clip ยาว 15 นาที ให ้ท่านตัดเป็ นคลิปย่อยๆ คลิปทีไม่ถอดความ เรียกว่า
Invalid clip ส่วนคลิปทีท่านฟั งและถอดความภาษาไทย เรียกว่า Valid Clip โดย Valid clip มีหลักเกณฑ์คอ ื
*มีอธิบายกฎ Mute Part 1. มีความยาวจํากัดไม่เกิน 15s. หรือ 15 วินาที
ต่อที faq 24 2. มีตังแต่ 1 ประโยคขึนไป แต่บางครังอาจเป็ นแค่คําเดียว เช่น ”ครับ”
3. ต ้องกําหนด Time stamp แบบฟิ ตคลืน หรือมี gap ไม่เกิน 0.03s. หรือ 0.03 วินาที
4. ห ้ามใช ้ label ทีต ้นหรือท ้ายสุดของข ้อความ
5. กฎ Mute Part หากผู ้พูดหยุดพูด เช่น “สวัสดี (หยุดพูดตังแต่ 2s.) เป็ นไงบ ้างล่ะ” ให ้ท่านแยกเป็ น 3
คลิป คือ สวัสดี / Invalid clip / เป็ นไงบ ้างล่ะ * ขอยกไปอธิบายต่อในข ้อ faq 24
สถานการณ์พเิ ศษ:
หากมี gap ระหว่างขอบคลืนเสียงของ valid clip ทีไม่เกิน 1s. ให ้ใช ้ Time stamp แบบกฎแบ่งครึง ตามภาพ
คําถามทีพบบ่อย คําตอบ
5) จะตรวจคําท ับศ ัพท์ให ้ คําทับศัพท์ ห ้ามสะกดเป็ นภาษาอังกฤษ ในงานนีต ้องสะกดเป็ นภาษาไทยทังหมด แบ่งหลักการออกเป็ น
ถูกต ้องตามหลักภาษาไทย 5.1 ต ้องสะกดคําทับศัพท์เป็ นภาษาไทยให ้ถูกต ้อง เช่น ชอปปิ ง/ เวิรก ์ ฟรอมโฮม/ ดิจท
ิ ัล/ ลิงก์/ ล็อกดาวน์/
โดยอ ้างอิงอย่างไร โปรโมชัน/ พอปคอร์น/ อะพาร์ตเมนต์ / สติกเกอร์ / สมาร์ตโฟน/ เช็ก / แพ็ก/ ชิล เป็ นต ้น โดยค ้นคําใน Google
search ได ้แก่ เว็บคําทับศัพท์ เว็บราชบัณฑิตฯ
ื บ ใช ้ตรวจคําทับ
*มีชอเว็ 5.2 ถ ้าเป็ นกลุม ิ ค ้า ชือบริษัท ชือคนมีชอเสี
่ คําแบรนด์สน ื ยง ชือทีมฟุตบอล ให ้สะกดตามไทยวิกพ ิ เี ดีย เช่น
ศัพท์ท ี faq23 เจสัน ยัง/ คลาแรงส์ ไม่ใช่สะกดตามเสียงว่า คาแรง เป็ นต ้น ถ ้ามีเว็บไซต์บริษัท หรือชือแบรนด์ ให ้ถือเป็ นคํา
เฉพาะ ให ้สะกดตามเว็บทางการหรือโบรชัวร์ทางการของบริษัทนัน เช่น ฟู้ดแพนด ้า แอปช ้อปปี
5.3 ถ ้าเป็ นชือเมือง ชือประเทศ ให ้สะกดตามไทยวิกพ ิ เี ดีย เช่น เมืองโอซากะ ไม่ใช่โอซาก ้า เป็ นต ้น
ตัวอย่าง “นมฮกไกโด ทีเมืองซัปโปโระประเทศญีปุ่ น” (แม ้ว่าเสียงจะเป็ น นมฮอกไกโดทีเมืองซับโปโร)
6) บางครังเปิ ดงานใหม่ แต่ ไม่ต ้องสนใจ คุณ judge และนํ าส่งงานได ้ตามปกติ
พบว่ามีใครกรอกข ้อความไว ้ (บางครังมีคนลาออกไปแล ้วและไร ้เจ ้าภาพ หรือเป็ นงานวนของใครทีทํางานไม่เสร็จมาก่อนหน ้า ระบบจึง reclaim
ก่อนแล ้ว จะทําอย่างไร กลับมา)
7) คําซํา จะสะกดอย่างไร ห ้ามใช ้ไม ้ยมก ให ้พิมพ์เต็มทุกคํา เช่น เสือสวยสวย / ทุกทุกคน เป็ นต ้น
8) ตัวเลขทีเป็ นจํานวน จะ ห ้ามใช ้ตัวเลขอารบิกเด็ดขาด
สะกดอย่างไร เว ้นวรรค สะกดภาษาไทยตามเสียง แต่ต ้องสะกดให ้ถูกต ้อง ไม่จําเป็ นต ้องเว ้นวรรคกับคําปกติ เช่น เพลย์ท/ู โควิดไนน์ทน
ี /
อย่างไร โควิดสิบเก ้า/ ปากกาสองสี/ ปี สองพันห ้าร ้อยหกสิบสี/ ยาวหนึงจุดสองมิล เป็ นต ้น
9) คําย่อสะกดอย่างไร ใช ้คําย่อได ้ แต่ให ้สะกดให ้ถูกต ้อง เช่น ส.ส. / ณ เวลานี / กทม. เป็ นต ้น
10) เว ้นวรรคอย่างไร เว ้นวรรคตามปกติของหลักภาษาไทย ไม่ใช่เว ้นวรรคตามเสียง
11) คําทีไม่เป็ นทางการ แต่ คําทีไม่เป็ นทางการ ต ้องถอดความเป็ นภาษาเขียน เช่น ครังนึง เป็ น ครังหนึง / ชันชอบเขา เป็ น ฉั นชอบเขา /
มีความหมายในภาษาไทย งันหรอ เป็ น งันเหรอ / จริงรึป่าว เป็ น จริงหรือเปล่า / ไปมัย เป็ น ไปไหม / อ่าวเหรอ เป็ น อ ้าวเหรอ / ซักครัง
จะถอดความอย่างไร เป็ น สักครัง เป็ นต ้น
คําทีไม่เป็ นทางการ ทีถอดความตามเสียงได ้ เช่น อย่างเงีย / แบบเนีย / เนียเหรอ / อะไรงี / เนาะ / เนอะ เป็ น
ต ้น
ถ ้าคุณได ้ยินเสียง สําหรับ project นี ให ้สะกดว่า หมายเหตุ
นันแหล่ะ นันแหละ โปรดสังเกต การสะกด
อ่ะนะ อะนะ ถูกต ้องอย่าสะกดตาม
ไปป่ ะ ไปปะ ความเคยชิน
มหาลัย มหาลัย
โรงบาล โรงบาล <= สะกดได ้ตามเสียง
มอไซค์ มอไซค์ เพราะมีความหมายแล ้ว
สองพันห ้าร ้อยสิบหนึง สองพันห ้าร ้อยสิบหนึง ในภาษาไทย
สองพันห ้าร ้อยเจ็ดห ้า สองพันห ้าร ้อยเจ็ดห ้า

แต่คําทีไม่มค
ี วามหมาย ต ้องสะกดให ้เต็มตามทีคุณทราบว่าเสียงกําลังหมายถึงอะไร
ถ ้าคุณได ้ยินเสียง สําหรับ project นี ให ้สะกดว่า
ครีมคาแรง ครีมคลาแรงส์
ยีบห ้า ยีสิบห ้า
12) ไหนบอกว่าให ้ถอด ให ้คุณถอดความตามเสียงทีได ้ยิน แต่ต ้องปฏิบัตต
ิ ามเกณฑ์ใน Guideline และเป็ นคําทีมีความหมายและสะกดได ้
ความตามเสียงทีได ้ยิน? ถูกต ้อง
เมือเริมงานครังแรก คุณต ้องอ่านทุกไฟล์ในโฟลเดอร์ Aragorn Long Audio Training ให ้ครบก่อนเริมงาน
13) คนใหม่ เพิงเริมงาน 1) ให ้อ่านทุกไฟล์ใน โฟลเดอร์นี ตามภาพทีแนบมา คือ folder Aragorn Training
ต ้องเริมอย่างไร 2) เพิมชือใน excel file โดยการ edit on line ด้วยโทรศ ัพท์มอ ื ถือ
3) เลือก notification in group คลิก “Yes”
4) รอรับอีเมล เพือรับ link เพือสอบก่อนเริมทํางาน คือการสอบ FRP หรือ First round pass เมือสอบ FRP ผ่าน
จึงจะได ้ link งานสําหรับการทํางานปกติ
5) เมือได ้รับลิงก์ ทีมีคําว่า FRP ให ้ท่านส่งเพียง 1 งานและจดเลข id ไว ้สือสารกัน,
5.1) ขอให ้ท่านทีเพิงเปิ ดงาน ทํางานแค่ item1 ทํา 25 clips + item2 ทํา 25 clips แล ้วหยุดใส่ clip 26
เป็ น invalid clip จากนันนํ าส่งงาน (ปุ่ ม Complete)ค่ะ
5.2) จากนันท่านก็แก ้งาน rework ไปมา วนอยูใ่ น 50 clips จนกว่า QA จะแจ ้งให ้ท่านทํางานต่อไปจนจบงาน

5.3) เมือ QA แจ ้งว่า งานทังงานสอบผ่าน frp ท่านจึงจะได ้รับ a new working link เพือรับงานต่อเนืองค่ะ

14) เมือกดส่งงานอาจพบ  ท่านต ้องทํางานถอดความทัง item1 and item 2 ให ้ครบถ ้วน


error จะตรวจสอบอย่างไร  ให ้ขยายเต็มจอแล ้วดู comment สีแดงทีมุมซ ้ายล่างของหน ้าจอ กดลูกศรเพือตรวจดูวา่ ผิดทีคลิปไหน
 หากมีคําว่า “…continuously” แสดงว่ามีการเว ้นวรรคมากกว่า 1 space ให ้ตรวจประโยคอีกครัง และอย่า
ลืมว่า ต ้องวรรคก่อนและหลังใช ้ label / ต ้องวรรคระหว่าง label ด ้วยกันด ้วย เช่น (noise) (sil)
 อาจมี valid clip ทีเผลอไปกดความยาวคลิปเกิน 15s. ทําให ้ท่านต ้องไปปรับแก ้ไขคลิปนันก่อนส่ง
 อาจจะลืมเลือก attributes (เช่น yes-Background noise) ซึงงานนีเป็ นเสียงคุยโทรศัพท์จงึ มีเสียงก ้อง
และซ่าๆ ตลอดทังงานจึงต ้องเลือก yes-Background noise ในทุก valid clips
คําถามทีพบบ่อย คําตอบ
15) การเลือก attributes มี หากเป็ น Invalid clip ได ้แก่ คลิปที Invalid ตังแต่ 1s. ขึนไปเสมอ คลิป Invalid เช่น ช่วงเงียบ ช่วงเสียง
default หรือไม่ หัวเราะ เสียงร ้องไห ้ เสียงอุทานทีสะกดไม่ได ้ เสียงต ้นหรือท ้ายประโยคทีฟั งไม่ได ้หรือสะกดไม่ได ้จึงเลือก label
ไม่ได ้ทําให ้ต ้องเลือกเป็ น Invalid clip ในกรณี Invalid clip ให ้ท่านเลือกแค่ attribute-Invalid เท่านัน แล ้วไม่
ต ้องถอดความคลิปนัน

หากเป็ น Valid clip มักจะเลือก attribute ดังนี


Effective -Valid
Background noise -Yes เพราะเป็ นเสียงคุยโทรศัพท์จงึ มีเสียงก ้องและเสียงซ่าๆ ตลอดทังงานเสียง
Sentiment -Clam
Abnormal -No
Style -Normal
16) การเลือก labels มีเกณฑ์การใช ้ดังนี
*มีอธิบายเรือง Noise 1) ห ้ามใช ้ต ้นหรือท ้ายประโยค
เพิมเติมที faq 27 2) ให ้เว ้นวรรค 1 space ก่อนหรือหลังการใช ้ label และเว ้นวรรค 1 space ระหว่าง label ด ้วยกัน เช่น
”ฉันชอบไป (sil) (noise) เทียวหัวหิน”
Labels ประกอบด ้วย label (noise), silence label (sil), doubt label (~), unknow label (unk)
17) การทํา Rework สําหรับ เมือเปิ ดงานจะเห็นสัญลักษณ์สเี ขียวกับสีชมพู สีเขียวหมายถึงคลิปนันถูกต ้องแล ้ว สีชมพูหมายถึง fail ให ้วาง
งานใน FRP link มีขันตอน เมาส์ทสีี ชมพูจะเห็น QA feedback ให ้ท่านรีววิ และแก ้ไขมาให ้ครบถ ้วน จากนันนํ าส่งงานอีกครัง
อย่างไร และหากพบ error
ตอนโหลดงานต ้องทํา
อย่างไร

หมายเหตุ : เนืองจากข ้อจํากัดของระบบ


ดังนันเมือ QA กด fail มาทีท่าน ระบบต ้องการเวลา 30 นาที ก่อนทีท่านจะเปิ ดงาน rework หากระบบ
error ท่านก็จะเห็นงานใหม่ aa ทีไม่ใช่งาน bb ทีท่านจะ rework แต่เนืองจากใน FRP link นันเราจะทํางานกัน
แค่ 1 งาน ดังนันจึงต ้องเพิมขันตอนให ้ท่านแจ ้งทางเมืองนอกเพือบล็อกงานใหม่ aa และ reload งาน rework
bb มาให ้ท่าน
ท่านต ้องจดเลขงานใหม่ไว ้ด ้วย เพือแจ ้งเมืองนอกตามตัวอย่างนี
“@Chris I found the error. Please block new id aa , and launch rework id bb for me.”
จากนันทางเมืองนอกจะแจ ้งว่า ได ้แก ้ไขให ้ท่านแล ้วและให ้ท่านกดเปิ ดงาน rework เพือให ้ท่านรีววิ ต่อไป
 หาก QA ไม่ได ้แจ ้ง แต่ทา่ นเห็นว่ามีเลข rework ขึนทีหน ้าจอของท่านแล ้ว ให ้ท่านบวกเวลาไปอีก 30
นาที ค่อยเปิ ดงานค่ะ จะได ้ไม่ต ้องคอยแจ ้งเมืองนอกเรือง error ค่ะ
18) การกําหนด Time ให ้ท่านกําหนด Time stamp ทีจุดเริมและสินสุดของช่วงเสียงทีท่านจะถอดความ ซึงไม่คร่อมกลางคลืนเสียงพูด
stamp และไม่ตัดกลางคําของข ้อความ มีเกณฑ์การดังนี
1) ให ้เว ้นช่วง gap ระหว่างขอบคลืนเสียงทีถอดความกับขอบ Time stamp ให ้ gap อยูใ่ นช่วงไม่เกิน
0.03 วินาทีหรือกําหนด Time stamp ชิดฟิ ตกับขอบคลืนเสียงทีถอดความ

2) ถ ้าผู ้พูดพูดประโยคยาว ท่านแยกเป็ นคลิปสันทีไม่สนมากจนเกิ นไป หรือไม่ยาวเกิน 15 วินาที
3) แต่ละคลิปย่อยควรเป็ นประโยคทีสมบูรณ์หนึงหรือมากกว่าหนึงประโยค ยกตัวอย่างเช่น “นีคือสิงทีท่าน
กล่าวถึง” ไม่ให ้ตัดคลิปย่อยเป็ น “นีคือสิง” และ “ทีท่านกล่าวถึง”
4) ห ้ามตัดกลางคํา ให ้กําหนดขอบ Time stamp อย่างแม่นยําทีสุดและไม่ตัดกลางคําทีผู ้พูดกําลังพูด
ข ้อความต่อเนืองอยู่
5) ใน 1 คลิปทีท่านถอดความจะเป็ นของผู ้พูดคนเดียวเท่านัน ยกตัวอย่างเช่น ในคลิปเสียงมีผู ้พูด B พูด
แทรกขึนเมือผู ้พูด A เพิงพูดจบ ให ้ท่านแยก A และ B เป็ นคนละคลิป (คลิป = segment)

หมายเหตุ
 ให ้สังเกตได ้ว่า ถ ้าขอบระหว่าง Invalid clip and Valid clip จะเป็ น Time Stamp แบบฟิ ตคลืน
 ถ ้าขอบระหว่าง Valid clip and Valid clip ทีมี gap ระหว่างคลืนน ้อยกว่า 1s. จะใช ้กฎแบ่งครึง Time
Stamp
 ถ ้าขอบคลืนระหว่างรอยต่อ Valid clip 1 and Valid clip 2 มีชว่ งเงียบเกินกว่า 1s. ต ้องอย่าลืม split
ออกเป็ น Invalid clip เพราะเป็ นกฏแยก Invalid clip ทีเกิน 1s.
19) คําอุทาน ต ้องถอดความ ท่านต ้องถอดความทังหมดรวมถึงคําอุทานด ้วย ซึงอาจจะเป็ น valid clip แบบคําโดดเป็ นเสียงคําอุทานได ้ หาก
หรือไม่ ไม่สามารถรวบกับ valid clip ก่อนหรือหลัง ให ้ความยาวคลิปไม่เกิน 15s มีเกณฑ์ดังนี
 หากท่านฟั งแล ้วถอดความได ้ เช่น อืม/ อ่า/ โอ๊ย(แสดงความเจ็บปวด) โอ๊ยโดนมีดบาด/ โอ ้ย(คําอุทาน
เชือมประโยคเวลาสนทนาทัวไป) โอ ้ย เธอสวยมากเลย/ โอย/ เอ่อ/ โอ ้โห/ อือหืม/ อุ ้ยตาย/ อือ/ เออ/
โอมายกอด เป็ นต ้น
 หากท่านฟั งแล ้วไม่สามารถถอดความได ้
o แต่เป็ นภายในประโยคข้อความ ให ้ท่านแทนทีคําอุทานทีท่านถอดความไม่ได ้โดยใส่ label
(~) หรือ (unk) ได ้
o ถ ้าเป็ นต ้นหรือท ้ายประโยค ทําให ้ท่านใส่ label ไม่ได ้ ให ้ท่านตัดช่วงคําอุทา่ นทีท่านถอด
ความไม่ได ้รวบไปกับ Invalid clip หรือหากเป็ นด ้านทีติดกับ Valid clip ก็ให ้ ignore เพราะ
น ้อยกว่า 1s แล ้วไปใช ้กฎแบ่งครึงขอบ Time stamp ปกติ
คําถามทีพบบ่อย คําตอบ
20) คําทีพูดไม่เต็มเสียง จะ คําบางคําทีผู ้พูดพูดไม่เต็มเสียง แต่คณ
ุ เข ้าใจความหมาย ให ้สะกดให ้ถูกต ้อง เช่น ไอ่แอปสีเขียว ให ้สะกดเต็มคํา
สะกดอย่างไร เป็ น ไอ ้แอปสีเขียว เป็ นต ้น เพราะเข ้ากฎ “ไอ่” เป็ นคําทีไม่มค
ี วามหมายจึงต ้องสะกดคําเต็มว่า ไอ ้ ซึงไม่ใช่
คําด่า เป็ นแค่คําในบทสนทนาทัวไป
21) คําว่า เค ้า สะกดอย่างไร ี นบทสนทนาทางโทรศัพท์ ในหลายครังเราใช ้คําว่า เค ้า ใน 2 ความหมายคือ ฉั น หรือ เขา
เนืองจากโปรเจกต์นเป็
ดี?  หากคําว่า เค ้า หมายถึง ฉั น หรือหมายถึงตัวผู ้พูดเอง เช่น เค ้าอยากซือกระเป๋ าจังเลย ให ้ท่านถอด
ความตามเสียงได ้ว่า “เค ้าอยากซือกระเป๋ าจังเลย”
 หากคําว่า เค ้า หมายถึง เขา หรือหมายถึงบุคคลอืน เช่น “ชันไปถามเค ้าแล ้ว เค ้าบอกว่าของเค ้าจริง”
ให ้ท่านถอดความคําว่า เค ้า เป็ น เขา และอย่าลืมว่า ชัน ต ้องสะกดเป็ น ฉัน ได ้ว่า “ฉั นไปถามเขาแล ้ว
เขาบอกว่าของเขาจริง”
22) การ split Clip และ รวบ ให ้ท่าน Zoom ทีระดับประมาณ 25 และท่านต ้อง split หรือรวบ Clip โดย
Clip ทําอย่างไร  วาง cursor ทีตําแหน่งทีต ้องการ split clip แล ้วกดปุ่ ม S
 วางเมาส์ทขอบ
ี clip ทีท่านต ้องการรวบ clip จนเกิดลูกศรซ ้ายขวา จากนันให ้ท่านคลิกเมาส์ขวา
23) คําทับศัพท์ทสะกดเป็
ี น คําทับศัพท์บางส่วน สามารถตรวจสอบคําสะกดได ้จากเว็บครูบ ้านนอก เช่น ดิจท
ิ ัล / ไลก์ เป็ นต ้น
ภาษาไทยจะอ ้างอิง ลิงก์รายการทับศัพท์คะ่ https://www.kroobannok.com/1818
ตรวจสอบจากเว็บใด
24) กฎ Mute Part เริมใช ้ เนืองจากลูกค ้าแจ ้ง ณ วันที 11feb2022 เวลา 20:00 น. ว่า งานนีเป็ นงานเสียงโทรศัพท์ทผู ี ้พูดใน Item 1 และ
วันที 11feb2022 Item 2 คุยกัน จึงอาจจะมีการเว ้นหยุดพูดเพือรอฟั งอีกฝ่ ายทีกําลังพูดอยู่ โดยไม่ใช่การหยุดจริงของประโยค
สนทนา ดังนันจึงมีกฎ Mute Part ว่า
 หากมีชว่ งเงียบในระหว่างทีผู ้พูดกําลังพูดอยูใ่ นช่วง valid sentence ทีเงียบตังแต่ 2 วินาที ให ้ตัดแยก
เป็ น Invalid clip ได ้ทันที ไม่วา่ ประโยคจะขาดความหมายหรือไม่
 ใน 1 valid clip ลูกค้า Prefer ทีจะมี “1 relative completed sentence ใน 1 valid clip”

ตัวอย่าง Mute Part ดังลูกศรสีเขียวในภาพนี คําอธิบาย กฎ Mute Part


ตัวอย่าง Mute part ใน clip 69 ในภาพ
“ สวัสดี ….เงียบเกิน 2 วินาที …..ขอบคุณ เดียวฉันโทร
ไปใหม่นะ”

ท่านต ้องแบ่งใหม่เป็ น 4 คลิป คือ


Valid clip = สวัสดี
Invalid clip = ช่วงทีเงียบเกิน 2 วินาที
Valid clip = ขอบคุณ
Valid clip = เดียวฉั นโทรไปใหม่นะ

สองประโยคหลังต ้องแยกคลิป เพราะลูกค้า prefer


ให้ใน 1 valid clip มีแค่ประโยคเดียว ซึงบางครัง
เป็ นคําโดด เช่น อ๋อ / ค่ะ / โอเค / อือ ก็เป็ น valid
clip ได ้ ไม่ต ้องซีเรียสทีจะรวบคลิปยาวให ้เป็ นประโยค
ไทยทีสมบูรณ์แบบไวยากรณ์ไทย เพราะลูกค ้าระบุไว ้
ว่า 1 relative completed sentence
ดังนัน ขอบคุณ / เดียวฉั นโทรไปใหม่นะ จึงแยกเป็ น 2
valid clip จะเหมาะสมกว่าการรวบยาวเป็ นคลิปเดียว

หมายเหตุ กฎเดิมทีสําคัญยังคงเดิม ได ้แก่


 กฎ 15s คือ 1 valid clip ต ้องมีเวลาไม่เกิน 15 วินาที
 กฎ 1s คือ 1 invalid clip ต ้องมีเวลาเกิน 1.01 วินาทีขนไป

 กฎแบ่งครึง คือ ขอบของ valid clip 2 clip ทีมีชว่ งเงียบไม่เกิน 1s. ให ้ใช ้ Time stamp แบบแบ่งครึง
(อ ้างอิงภาพใน faq4)
 กฎฟิ ตคลืน คือ ขอบของ valid กับ invalid clip ต ้องใช ้ Time stamp แบบฟิ ตคลืนหรือมี gap ไม่เกิน
0.03s.
 กฎ label ทีต ้อง 1 วรรคก่อนและหลังการใช ้ label และ 1 วรรคระหว่าง label ด ้วยกัน
คําถามทีพบบ่อย คําตอบ
25) ทุกงานมีเวลาจํากัด สําหรับงานผู ้ถอดความ ท่านมีเวลาทํางาน งานละ 4,000 นาที นับแต่เปิ ดงานถึงกดปุ่ ม complete นํ าส่งงานเข ้า
หรือไม่ ถ ้าส่งไม่ทันจะเป็ น ระบบค่ะ แม ้ท่านจะปิ ดหน ้าจอไป ระบบก็จะนับเวลาถอยหลังอย่างต่อเนือง หากท่านนํ าส่งงานไม่ทัน ระบบจะลบ
อย่างไร งานถอดความของท่านทังหมดแล ้ววนไปเป็ นงานใหม่ของผู ้อืนค่ะ ท่านจึงต ้องเปิ ดงานใหม่ แต่ถ ้าท่านยังต ้องการ
ทํางาน ID นันใหม่อก ี ครัง เช่น id 123 ท่านก็สามารถแจ ้งทางเมืองนอกว่าขอ reclaim id 123 และทํางานอีก
ครัง แต่ทา่ นต ้องเริมต ้นใหม่ทังหมดและไม่สามารถกู ้ข ้อมูลเก่าได ้เลยค่ะ

ดังนันให ้สังเกตเวลาทีมุมขวาบนเสมอและพยายามรีบกดนํ าส่งงานก่อนหมดเวลาโดยเผือสัก 20 นาที เพราะท่าน


อาจต ้องแก ้ไขงานตาม error เช่น ลืม Attributes, ลืมเว ้นวรรคก่อนและหลังการใช ้ label เป็ นต ้น

26) กรณีภาษาไทยภูมภิ าค สําหรับเสียงภาษาไทยภูมภ


ิ าค เช่น ภาษาเหนือ ภาษาอีสาน ภาษาใต ้ หรือเสียงคนพม่าพูดภาษาไทย หรือเสียง
จะต ้องถอดความปกติหรือไม่ คนต่างชาติพูดภาษาไทย ในโปรเจกต์ Aragorn Long Audio นี ท่านสามารถถอดความได ้ค่ะ ไม่จําเป็ นต ้อง
Invalid task
หากท่านฟั งแล ้วสะกดไม่ได ้
เกิน 30% ท่านสามารถเลือก ทังนี
Invalid task ได ้_  หากท่านสามารถสะกดและถอดความได ้ ท่านสามารถถอดความได ้ปกติ เช่น หมูเ่ ฮาปิ กบ ้านกันเถอะ
 หากท่านไม่สามารถสะกดได ้ และไม่สามารถหาคําอ ้างอิงตัวสะกดได ้ ท่านสามารถเลือกเป็ น Invalid
clip หรือใช ้ label (unk) ได ้ เช่น อิยังก่อ/ อีหยังก่ / อีหยัง เป็ นต ้น
 แต่ขออ ัปเดต ณ ว ันที 16feb2022 ว่า ลูกค้าต้องการให้ใช ้ label (unk) หรือ doubt
้ ยทีสุดหรือไม่ใชเ้ ลย หากท่านตรวจพบว่าต ัวเองใส่ label เหล่านี
(~) ในงานนีให้นอ
มากเพราะฟังไม่ออกเยอะมาก ให้ทา ่ นรีบแจ้งประเด็นแปลกๆ นีพร้อมเลข id ของ
งานในห้องแชท เพราะงานนนอาจจะเป
ั ็ น Invalid task ซึงท่านไม่ตอ
้ งถอดความ
เลย

27) เรืองการใช ้ label หากมี ณ วันที 16 feb 2022


กรณีมี noise ซ ้อนเสียงพูดที ลูกค ้าแจ ้งว่า มีงานบางงาน ทีมีเสียงพูดพร ้อมๆ กับ noise ทีต ้น หรือ ท ้ายประโยคข ้อความ valid clip เช่น
ต ้นหรือท ้ายประโยค จะทํา พูดกลัวหัวเราะ หรือ พูดแล ้วมีเสียงปรบมือทีต ้นหรือท ้ายประโยคจริงๆ อีกทังเราไม่สามารถใส่ label ทีต ้นหรือ
อย่างไร ท ้ายสุดของข ้อความได ้ตามหลักการ faq 16

ลูกค ้าแจ ้งว่า ให ้พิมพ์คําต ้น แล ้วจึงใส่ (noise) หรือ ใส่ (noise) ก่อนคําสุดท ้ายของประโยคใน valid clip

เช่น ฉั น (noise) ยังขําค ้างอยูเ่ ลย = หัวเราะพร ้อมๆ กับพูดคําว่า ฉัน


หรือ ก็เป็ นเช่นนัน (noise) ครับ = มีเสียงปรบมือพร ้อมๆ กับเสียงพูดว่า ครับ
28) การกดแป้ นอักษรเพือ ลูกค ้าตรวจพบว่า มีภาษาไทยบางคําทีคอมพิวเตอร์ถอ
ื ว่า fail หากคุณกดลําดับในการกดแป้ นอักษรผิด
สะกดคําภาษาไทย บางคํา
เพราะหลายท่านจะชินกับการกดแป้ นอักษรในมือถือหรือภาษาแชท ทําให ้ละเลยกฎการพิมพ์อักษร ซึงเมือท่าน
ต ้องมีเทคนิคในการกดแป้ น
ใช ้ลําดับการกดแป้ นอักษรทีผิดหลักของแป้ นพิมพ์ จะทําให ้ลูกค ้าเห็นตัวอักษรทีกระโดด คลาดเคลือนจาก
คําสะกดทีถูกต ้อง แล ้วจะทําให ้พวกเราได ้คะแนน fail ส่งงานทีด ้อยคุณภาพ ยกตัวอย่างเช่น
สระ กับ
วรรณยุกต์ ตัวอย่าง งาน Fail ได ้แก่ งานทีถูกต้อง คือ
ภาษาไทย
วรรณยุกต์
ต ้องก่อน นํ า นํ า = น + พิมพ์แป้ นสระอํา แล ้วค่อยใส่ ไม ้โท นํ า = น + พิมพ์แป้ นไม ้โท ก่อนแป้ นสระอํา
สระอํา
สระ แอ
ต ้องใช ้แป้ น แก แก = พิมพ์แป้ นสระ เ จํานวนสองครัง + ก แก = พิมพ์แป้ นสระ แ + ก
สระแอ
29) การสะกดคําต ้องสะกด การสะกดคําถอดความเสียงพูด แต่ต ้องสะกดให ้ถูกต ้องด ้วย เช่น
ให ้ถูกต ้อง ขอยกตัวอย่างคํา ได ้ยินว่า ให ้สะกดถอดความว่า หมายเหตุ
ทีพบบ่อย จะแว ้บไป จะแวบไป อักษรตําจะผันได ้แค่สามเสียง คือสามัญ เอก โท ดังนัน "ว ้าย" ไม่ใช่ "ว๊าย" ,
"แวบ" ไม่ใช่ "แว๊บ"
เช่น เสียง = แว ้บ / แมะ / โอ ้มายก๊อด โอมายกอด ไม่ใช่คําอุทานปกติ ให ้ใช ้แบบคําทับศัพท์ โดยให ้ไป research ใน google
ปะ/ ป่ าว/ ดิจต
ิ อล ใช่ป่าว ใช่เปล่า ป่ าวเป็ นภาษาพูด ต ้องสะกดทางการว่า เปล่า
ใช่ปะ ใช่ปะ อันนีสะกดได ้ตามเสียง ใช ้ “ปะ” ได ้ในงานนี
ไปรึปะ ไปหรือเปล่า รึปะ เป็ นภาษาพูด ต ้องสะกดทางการว่า หรือเปล่า
#ใช่แม่ะ แฮชแท็ก ใช่แม่ะ สะกดได ้ตามเสียง เพราะบังเอิญมีคํานีในแฮชแท็กจริง เป็ นศัพท์วัยรุ่น
เธอจะไปแมะ เธอจะไปไหม แมะ เป็ นภาษาพูด ต ้องสะกดทางการว่า ไหม และตรงความหมายด ้วยเพราะ
เป็ นแนวประโยคคําถาม
ดิจต ิ อล ดิจท
ิ ัล
ช ้อปปิ ง ชอปปิ ง ให ้จดไปใช ้เลยแล ้วกัน คําเหล่านีเป็ นคําทีพบบ่อย พบมาหลาย Appen
บุ ้กกิง บุกกิง Project แล ้วว่าสะกดแบบนีค่ะ จะได ้ไม่เสียเวลาไปค ้นหาค่ะ
โปดัก โปรดักต์
โปรโมชัน โปรโมชัน
wifi วายฟาย

You might also like