00-Vietnam Transcribing Standard-V

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

Transcribing requirements

1. Validity judgment
1) If the following situations occur in a paragraph, then this paragraph is invalid, and
subsequent work such as transcription and labeling are not needed:
a) The voice is extremely small to hear the content clearly;
b) The entire paragraph contains only noise or silence;
c) If a sentence contains a non- Vietnamese part, do not transcribe;
d) If there is strong noise (environmental noise, equipment noise) in a paragraph that
makes it difficult to hear the main speaker, and it is not suitable to cut into smaller
paragraphs, then do not transcribe
e) In a paragraph, if two people’s voice overlap a lot with each other and their voices
are close in volume, then do not transcribe this paragraph; if the overlapped
content is few (only one or two words), and the main speaker can be heard clearly,
then transcribe;
f) If there is frame loss in a sentence, do not transcribe the paragraph;
g) If a paragraph is not a normal human voice (e.g. machine customer service,
synthesized voice, TV broadcast sound), do not transcribe the paragraph;
h) If a sentence contains a non-German part, the sentence is judged to be invalid;
i) If a paragraph involves sensitive information (account type, address type), do not
transcribe the paragraph; Sensitive information includes: mobile phone number,
order number, bank card number, address, politically sensitive, religiously sensitive
2. Effective voice interception
1) Transcribers need to take semantic coherence into consideration and transcribe
paragraphs in units of sentences. Long sentences can be transcribed into constituent
paragraphs. The maximum length of each paragraph should not exceed 8 seconds, and
it should not be too short. According to the experience, each natural conversation
paragraphs take 5-6 seconds on average;
2) The best boundary are each paragraph is at the lowest point of the waveform. If only a
few words are not included, you can consider to discard these words;
3) The voices of different speakers cannot be in the same paragraph, if they can be cut
into different paragraphs;
4) If possible leave a 0.2~0.3 second silence at the beginning and the end of speaker’s
voice in one paragraph. If possible cut the paragraph without sudden noise. In order to
avoid sudden noise, the reserved time before and after the speech can be shortened,
but do not cut one word a half;
5) If there is only one word as response, it does not need to be divided into single
paragraph. If it can be merged into the next paragraph, then merge;
6) If a sentence has a silent period of more than 2s due to the speaker's pause, it needs to
be cut into two paragraphs, regardless of the meaning of the sentence; if the pause
time is less than two seconds and the length of the single paragraph does not exceed
8s, it should be in one paragraph.
3. Speaker identification
During the collection process, the recorder will first report the project number and recorder
number, and this part does not need to be transcribed. Just remember the identities of
different speakers (corresponding to the number reported by the recording person at the
beginning), then select the role attributes for different speaker in each paragraph.
4. Content transcription
Transcribers need to transcribe the content based on the audio they hear, and it must be
exactly the same as the audio. No more words, fewer words, or typos. The general
guidelines are as follows:
1) Number
The numbers in the audio need to be transcribed into corresponding words. No Arabic
numerals.
2) Abbreviation
Take English as example. If the speaker reads the word one by one, then transcribe as
pronounced; if the speak reads the Abbreviation in a word way, then transcribe in
lower case. For example: if it is pronounced one by one, "NASA"; if it is read as a word,
“nasa”.
3) Modal particles
Modal particles should be accurately transcribed according to pronunciation and
semantics.
4) Punctuation
a) The punctuation spoken by the speaker needs to be transcribed, such as: "@" is
transliterated as "at", ".com" is transliterated as "dot com"
b) Only commas, hyphens, periods, exclamation marks, abbreviations, possessive
symbols, and question marks are allowed in the transliteration process.
Punctuation other than these six points cannot be added. The added symbols
must comply with the grammatical rules. All symbols need to be in the normal
English input state
5) Other
a) The content of swear words are normally transcribed, and letters should not be
used instead
b) Internet hot words and common Internet words are transcribed according to
common usage
c) If there are repetitive words in the speech, then all words should be transcribed
d) If the pronunciation is relatively clear, but the semantics are uncertain, such as
ordinary names, etc., you can choose homophones instead, but you need to
ensure that the text and pronunciation are consist. In the case of a clear
contextual sentence meaning, select words that conform to the pronunciation and
sentence meaning for labeling.
5. Quality Assurance
The accuracy of the marked sentence should be 95% and above (100% is required for the
symbol format)
If a part of the sentence has the following labeling errors: wrong labeling, valid error, etc.,
then this sentence is deemed to be an incorrectly labeling sentence.
Accuracy rate = 1-(number of incorrectly transcribed sentences/number of all checked
sentences)
Yêu cầu phiên âm
1. đánh giá độ bền
1) Nếu các tình huống sau đây xảy ra trong một đoạn văn, thì đoạn văn này không hợp lệ và
các công việc tiếp theo như phiên âm và ghi nhãn là không cần thiết:
a) Giọng nói cực nhỏ để nghe rõ nội dung;
b) Toàn bộ đoạn văn chỉ có tiếng ồn hoặc khoảng lặng;
c) Nếu câu có phần không phải tiếng Việt thì không được phiên âm;
d) Nếu có tiếng ồn mạnh (tiếng ồn từ môi trường, tiếng ồn thiết bị) trong một đoạn văn
khiến người nói chính khó nghe và không phù hợp để cắt thành đoạn văn nhỏ hơn thì không
nên phiên âm.
e) Trong một đoạn văn, nếu giọng của hai người trùng lặp nhiều với nhau và giọng của họ
gần nhau về âm lượng thì không được phiên âm đoạn này; nếu nội dung trùng lặp ít (chỉ
một hoặc hai từ) và người nói chính có thể nghe rõ thì hãy phiên âm lại;
f) Nếu câu bị mất khung hình, không được phiên âm đoạn văn đó;
g) Nếu một đoạn văn không phải là giọng nói bình thường của con người (ví dụ: dịch vụ
chăm sóc khách hàng bằng máy, giọng nói tổng hợp, âm thanh phát sóng trên TV) thì không
được phiên âm đoạn văn đó;
h) Nếu câu có phần không phải tiếng Đức thì câu đó bị coi là không hợp lệ;
i) Nếu một đoạn văn liên quan đến thông tin nhạy cảm (loại tài khoản, loại địa chỉ), không
được phiên âm đoạn văn đó; Thông tin nhạy cảm bao gồm: số điện thoại di động, số đơn
đặt hàng, số thẻ ngân hàng, địa chỉ, nhạy cảm về chính trị, nhạy cảm về tôn giáo
2. đánh chặn giọng nói hiệu quả
1) Người phiên dịch cần xem xét tính nhất quán về ngữ nghĩa và phiên âm các đoạn văn theo
đơn vị câu. Các câu dài có thể được phiên âm thành các đoạn văn cấu thành. Độ dài tối đa
của mỗi đoạn không được vượt quá 8 giây và không được quá ngắn. Theo kinh nghiệm, mỗi
đoạn hội thoại tự nhiên trung bình mất từ 5-6 giây;
2) Ranh giới tốt nhất là mỗi đoạn nằm ở điểm thấp nhất của dạng sóng. Nếu chỉ có một số
từ không được bao gồm, bạn có thể xem xét để loại bỏ các từ này;
3) Giọng của những người nói khác nhau không được ở trong cùng một đoạn, nếu chúng có
thể bị cắt thành nhiều đoạn khác nhau;
4) Nếu có thể, hãy để khoảng lặng 0,2 ~ 0,3 giây ở đầu và cuối giọng nói của người nói trong
một đoạn văn. Nếu có thể, hãy cắt đoạn văn mà không bị nhiễu đột ngột. Để tránh gây ồn ào
đột ngột, có thể rút ngắn thời gian dự trữ trước và sau bài phát biểu, nhưng không cắt bỏ
một từ một nửa;
5) Nếu chỉ có một từ làm câu trả lời thì không cần chia thành đoạn đơn. Nếu nó có thể được
hợp nhất vào đoạn tiếp theo, sau đó hợp nhất;
6) Nếu một câu có khoảng thời gian im lặng quá 2 giây do người nói ngắt lời thì cần phải cắt
thành hai đoạn, không phân biệt ý nghĩa của câu; nếu thời gian tạm dừng dưới hai giây và
độ dài của đoạn đơn không quá 8 giây, thì nó phải là một đoạn.
3. nhận dạng loa
Trong quá trình thu thập, đầu tiên người ghi sẽ báo số dự án và số đầu ghi, phần này không
cần phiên âm. Chỉ cần nhớ danh tính của các diễn giả khác nhau (tương ứng với số lượng mà
người ghi âm báo cáo ở phần đầu), sau đó chọn thuộc tính vai trò cho người nói khác nhau
trong mỗi đoạn.
4. nội dung phiên âm
Người biên dịch cần phiên âm nội dung dựa trên âm thanh họ nghe được và nội dung đó
phải giống hoàn toàn với âm thanh. Không có nhiều từ hơn, ít từ hơn hoặc lỗi chính tả. Các
nguyên tắc chung như sau:
1) Số
Các số trong âm thanh cần được phiên âm thành các từ tương ứng. Không có chữ số Ả Rập.
2) Viết tắt
Lấy tiếng Anh làm ví dụ. Nếu người nói đọc từng từ một, sau đó phiên âm như đã phát âm;
nếu bài nói đọc Viết tắt theo một từ, thì hãy phiên âm bằng chữ thường. Ví dụ: nếu nó được
phát âm từng cái một, "NASA"; nếu nó được đọc là một từ, "nasa".
3) Các hạt phương thức
Các hạt phương thức nên được phiên âm chính xác theo cách phát âm và ngữ nghĩa.
4) Dấu câu
a) Dấu câu mà người nói nói cần được phiên âm, chẳng hạn như: "@" được phiên âm là
"at", ".com" được phiên âm là "dot com"
b) Chỉ được phép sử dụng dấu phẩy, dấu gạch nối, dấu chấm, dấu chấm than, chữ viết tắt, ký
hiệu sở hữu và dấu chấm hỏi trong quá trình chuyển ngữ. Không thể thêm dấu câu ngoài
sáu điểm này. Các ký hiệu được thêm vào phải tuân thủ các quy tắc ngữ pháp. Tất cả các ký
hiệu cần ở trạng thái đầu vào tiếng Anh bình thường
5) Khác
a) Nội dung của các từ chửi thề thường được phiên âm và không nên sử dụng các chữ cái để
thay thế
b) Các từ nóng trên Internet và các từ thông dụng trên Internet được phiên âm theo cách sử
dụng phổ biến
c) Nếu có các từ lặp lại trong bài phát biểu thì phải phiên âm tất cả các từ.
d) Nếu phát âm tương đối rõ ràng nhưng ngữ nghĩa không chắc chắn, chẳng hạn như tên
thông thường, v.v., bạn có thể chọn từ đồng âm để thay thế, nhưng cần đảm bảo rằng văn
bản và cách phát âm nhất quán. Trong trường hợp câu có ngữ cảnh rõ ràng, hãy chọn những
từ phù hợp với cách phát âm và nghĩa của câu ing để ghi nhãn.
5. đảm bảo chất lượng
Độ chính xác của câu được đánh dấu phải từ 95% trở lên (yêu cầu 100% đối với định dạng ký
hiệu)
Nếu một phần của câu có các lỗi ghi nhãn sau: ghi nhãn sai, lỗi hợp lệ, v.v. thì câu này được
coi là câu ghi nhãn sai.
Tỷ lệ chính xác = 1- (số câu được phiên âm sai / số lượng tất cả các câu được kiểm tra)

You might also like