Professional Documents
Culture Documents
Forester Portuguese (Brazil) Transcription Guidelines 2023 - ADAP QF
Forester Portuguese (Brazil) Transcription Guidelines 2023 - ADAP QF
Forester Portuguese (Brazil) Transcription Guidelines 2023 - ADAP QF
5 l
Forester Portuguese (Brazil) Transcription
48 tia
Guidelines
Introduction
20 n
Project goal: The goal of this project is to transcribe audio files that will ultimately help our client build
state of the art automatic speech recognition models.
The aim of this project is to accurately transcribe (i.e. type out or represent with pre-filled tags) the speech
presented to you in audio files. You will be using our online transcription platform called "ADAP Quality Flow". A
e
separate guide is provided for using ADAP Quality Flow.
50 id
Please read these guidelines in full and keep them handy when you start transcription. There are a lot of
things to remember, but you will find it gets easier once you have done a few transcriptions. If anything is
unclear, please contact the project manager. Good luck!
nf
Objetivo do Projeto: O objetivo deste projeto é transcrever arquivos de áudio que ajudarão nosso cliente
a construir modelos de reconhecimento automático de fala.
O objetivo deste projeto é transcrever com precisão (ou seja, digitar ou adicionar os tags - veja abaixo as regras
dos tags) a fala apresentada nos arquivos de áudio. Você utilizará nossa plataforma de transcrição online
chamada "ADAP Quality Flow". Um guia separado é fornecido para o uso do ADAP Quality Flow.
Co
Por favor, leia atentamente as guidelines e mantenha-as com fácil acesso. Há muitas coisas para lembrar,
mas ficará mais fácil depois de fazer algumas transcrições. Se algo não estiver claro, entre em contato com o
gerente do projeto. Boa sorte!
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
General information
The purpose of this project is to transcribe all valid speech as well as the
non-speech sounds which occur at the same time as speech.
20 ne ●
●
●
hesitations ("um", "er"),
colloquial words ("gonna", "wassup"), and
repeated words ("they they was gonna be there.").
O objetivo deste projeto é transcrever toda a fala, bem como os sons não
relacionados à fala que ocorrem ao mesmo tempo que a fala.
50 id
Speech se refere a qualquer coisa que contenha linguagem humana. Neste
projeto, transcrevemos a fala, mesmo que não seja gramaticalmente correta, o
que inclui:
Example
Co
5 l
Non-speech sounds which occur during speech also need to be tagged. If
48 tia
non-speech sounds such as music, laughter, coughing, clicks, and bangs occur
within 1 second of speech, these sounds should be tagged.
20 ne If an entire unit doesn't contain any speech (words), then the sounds that occur
in this unit should not be tagged. Instead, use the tag no speech and move on.
If the unit contains speech, then insert the tag no speech wherever a pause
longer than one second occurs.
Se uma unit inteira não tiver nenhum speech (palavras), então os sons que
ocorrerem nessa unit não devem ser marcados. Em vez disso, utilize o tag no
speech e continue a próxima unit.
50 id
Se a unit tiver speech (fala), insira o tag no speech sempre que ocorrer uma
pausa mais longa do que um segundo.
Your volume settings should be set so that the loudest speaker in the unit is at a
comfortable volume. Foreground speech is any speech which can be clearly
nf
Speech which is clearly quieter than the foreground volume (i.e. quiet speech
coming from the background that can be understood with some effort) should be
transcribed following all guidelines in this document, using the same conventions
as foreground speech and noises, and additionally tagged as background
using the <bg></bg> span tag. For background speech that can’t be understand,
5 l
a tag <bg></bg>. Para o speech no background (segundo plano) que não pode
48 tia
ser compreendida, use .
A unit is a single unit of transcription. Each unit has its own text input box and it
does not need to be saved (i.e. the transcription is automatically saved) to move
on to the next unit. The breaks between units can generally be ignored: they are
only intended to break up the audio into easily transcribable sections.
Units
Uma unit é uma única unidade de transcrição. Cada unit tem sua própria caixa
20 ne de texto e não precisa ser salva (ou seja, a transcrição é salva automaticamente)
para passar para a próxima unidade. As pausas entre as unidades geralmente
podem ser ignoradas: elas servem apenas para dividir o áudio em seções de
transcrição mais fáceis. Salve todas as unidades juntas antes de seguir para a
próxima página.
A unit group of transcription work is a single, continuous audio file which is further
divided into pages and units.
50 id
Unit Group
Um Unit Group (grupo de units) é um único arquivo de áudio contínuo que é
posteriormente dividido em páginas e units.
For some unit groups, you will see additional information about the source of the
audio in the Description section.
nf
Please use this information to guide your spelling decisions for proper nouns
such as person names, location names, products and brand names.
Note: this additional information may contain spelling errors. Please use your
judgment when using this information for proper nouns. If you’re not certain,
please do an online search to confirm the spelling.
Co
Source
Para alguns unit groups, você verá informações adicionais sobre a origem do
áudio na seção de Descrição.
Por favor, use essas informações para orientar suas decisões na ortográficosde
nomes próprios, como nomes de pessoas, nomes de locais, produtos e marcas.
Nota: esta Descrição pode conter erros ortográficos. Por favor, use seu bom
senso ao usar essas informações para nomes próprios. Se você não tiver
certeza, faça uma pesquisa online para confirmar a ortografia.
To help you be more productive with transcription, you can utilize the keyboard
shortcuts for event tags and span tags. To use the shortcuts, make sure the
Shortcuts cursor is active in the text box and then press the keyboard combinations.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Para ajudar você a ser mais produtivo na transcrição, você pode utilizar os
48 tia
shortcuts (atalhos do teclado) para os event tags (sons e etc) e tags de span
(utilizados para destacar as palavras). Para usar os shortcuts, certifique-se de
que o cursor esteja ativo na caixa de texto e, em seguida, pressione as
combinações de teclas no teclado.
implementar a tag (por exemplo, Ctrl + Alt + A para coloquial ou Ctrl + Alt + C
para pronúncia incorreta)
Co
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Transcribing speech
48 tia
Use a ortografia correta para o português
Examplo:
Correto Incorreto
exato exacto
20 ne
Spelling
Use standard contractions ("I'm", "could've", "let's" but not "tryna" or "'em") if this
is how a word is pronounced in the audio. Also use possessive apostrophes
where necessary, e.g. "Mike's job", "both kids' toys".
If a pronunciation is only one sound different from its conventional spelling, please
use the conventional spelling. If the spoken form differs by more than one sound,
and there is a commonly used Portuguese spelling, please use that spelling.
Co
Example
One sound different
5 l
Exemplo:
48 tia
Diferença de um som
● Nóis ==> TRANSCRIÇÃO: nós
● cê ==> TRANSCRIÇÃO: você
● tava ==> TRANSCRIÇÃO: estava
● migo ==> TRANSCRIÇÃO: amigo
● morzinho ==> TRANSCRIÇÃO: amorzinho
● tá ==> TRANSCRIÇÃO: está
20 ne
Capital letters
Use Portuguese capitalization rules with one exception: do not use a capital
letter if the only reason to do so is that the word is at the start of a
sentence.
Utilize as regras de capitalização em português, com uma exceção: não use uma
letra maiúscula se a única razão para fazê-lo for que a palavra está no início de
uma frase.
50 id
A maioria dos nomes de pessoas ("Barack Obama"), nomes de locais ("Golden
Gate Bridge", "Rússia"), produtos e marcas ("Five Guys", "YouTube") devem ser
capitalizadas.
For transcribing a unit that appears to contain Portuguese proper nouns (brand
names, place names, people’s names, etc), the key is to understand which
language the word is intended to be in and transcribe as is. In cases where it can
nf
Enter this tag in place of the speech which cannot be understood after three
unintelligible attempts at listening.
If there is more than one unintelligible word in sequence, use a single tag. If the
entire sentence or unit cannot be understood, use a single unintelligible tag.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Also use this tag for word fragments and stutters.
48 tia
If you cannot understand a word because it is in a foreign language, use the
tag.
Use o marcador de posição para uma palavra ou várias palavras que não podem
ser compreendidas devido a interferência, problemas de áudio ou porque a
pessoa não está falando claramente. Insira esse tag no lugar do speech que não
20 ne pode ser compreendida após três tentativas de escuta. Se houver mais de uma
palavra ininteligível em sequência, use um único tag. Se toda a sentença ou unit
não puder ser compreendida, use um único tag de "ininteligível".
Se você não conseguir entender uma palavra porque ela está em uma língua
50 id
estrangeira, use o tag .
Examplo
O speaker fala uma palavra que você não entende
TRANSCRIÇÃO: ir amanhã
Use when two or more speakers talk at the same time at more or less the same
Co
Do not use the overlap tag when there is background speech and you can clearly
hear a single foreground speaker. In such cases, ignore the background speech
overlap and transcribe the foreground speech and noises only.
Use quando dois ou mais speakers falam ao mesmo tempo, mais ou menos com
o mesmo volume (ou ambos os speakers em primeiro plano ou ambos em
segundo plano). NÃO transcreva a fala sobreposta, insira este rótulo no lugar das
palavras sobrepostas.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Se ambos os falantes estiverem em segundo plano, use a tag <bg></bg>
48 tia
juntamente com .
20 ne The definition of singing for the purpose of this project is: making musical and/or
rhythmic sounds with your voice.Note that we have two different tags for singing.
The <singing/> tag is reserved for live singing, as described in this section, by a
foreground or background speaker.
⚠ Sung lyrics in recorded audio are not tagged as <singing/> for the purpose of
50 id
this project, but should rather use the tag <lyrics/>. See the section below for
details on how to apply the <lyrics/> tag.
Note that these categories are considered speech (not singing) if they are not
pronounced in the manner described above.
There are two ways to treat singing in this project: a tag to replace
each word or group of words that is sung that you do not know or cannot
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
understand and a span tag to surround words that
are sung and that you can write down.
Singing is considered as speech and therefore the same rule applies: the
20 ne Recital de poesia
Rap
Canto
Sermões religiosos ritualísticos
Observe que essas categorias são consideradas speech (não canto) se não
forem pronunciadas da maneira descrita acima.
50 id
Existem duas maneiras de tratar o canto neste projeto: um tag para substituir
cada palavra ou grupo de palavras que é cantado e que você não conhece ou
não consegue entender, e uma tag de intervalo para cercar palavras que são
cantadas e que você pode escrever.
O canto é considerado como speech e, portanto, a mesma regra se aplica: a tag
deve ser usada para marcar a mudança de falante/cantor.
nf
1. Use the event tag for a sung word or a group of sung words that
you cannot understand (e.g. unintelligible singing, mumbling...) or words sung in a
foreign language (even if you can understand it). Use the event tag
Co
5 l
Examplo:
48 tia
Um speaker começa uma frase em português e depois diz uma palavra
em alemão, mas cantando “kaaaartoffeeeeellll!”.
TRANSCRIÇÃO:
If there is more than one word sung in a sequence, please use a single singing
tag for all unintelligible words sung.
50 id
Se houver mais de uma palavra cantada em sequência, por favor, use um único
Examplo:
nf
TRANSCRIÇÃO:
Co
Examplo:
Alguém está cantando duas palavras que você não entende e alguns
segundos depois alguém começa a fazer rap ao mesmo tempo.
TRANSCRIÇÃO:
Examplo:
Alguém recita um poema em francês e então o speaker muda.
TRANSCRIÇÃO:
2. If you can understand the sung words (and they are in Portuguese), write them
down and surround them with the span tag .
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
2. Se você consegue entender as palavras cantadas (e elas estão em inglês),
escreva-as e coloque-as entre o span tag .
Examplo:
Alguém está recitando um poema.
TRANSCRIÇÃO:
/!\ Tips:
● Use the event tag for sung words that you cannot
understand.
● Use the event tag for each or group of foreign sung words,
even if you can understand it.
● Use the event tag only for a speaker singing, and not for
lyrics in recorded music that appears in the unit. For lyrics in recorded
music, use the <lyrics/> tag instead.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
● Ignore music that accompanies singing. Brief periods of music alone
48 tia
without singing within a unit should also be ignored.
● Use the tag for singing like you do for spoken speech:
when the speaker or singer changes.
● Use punctuation in places where it falls naturally in songs, singsong
words, poems or sermons.
● If multiple people sing the same words at the same time, please transcribe
it as one speech.
20 ne ●
●
If multiple people sing different words at the same time (i.e. different
.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
● Se canto e fala ocorrerem ao mesmo tempo e com um volume
48 tia
semelhante, use a tag .
● Se canto e fala ocorrerem ao mesmo tempo, mas um dos dois estiver em
segundo plano, transcreva apenas o que estiver em primeiro plano.
Lyrics in recorded, produced musical audio that appears in the unit should be
transcribed similarly to singing, but using the <lyrics/> tags instead of the
<singing/> tags.
20 ne 1. Use the <lyrics/> event tag for a word or group of words in the lyrics that you
cannot understand (e.g. unintelligible singing, mumbling...) or for a word or group
of words in a foreign language in the lyrics (even if you can understand it). Use
the <lyrics/> event tag for scatting/nonsense singing.
For a sequence of lyrics with more than one word, please use a single lyrics tag
to represent all unintelligible lyrics.
50 id
2. If you can understand the words of the lyrics (and they are in the target
language), write them down and surround them with the span tag
<lyrics>word</lyrics>.
Lyrics unidade devem ser transcritas de maneira semelhante ao canto, mas usando as
tags <lyrics/> em vez das tags <singing/>.
1. Use o event tag <lyrics/> para uma palavra ou grupo de palavras nas
letras que você não consegue entender (por exemplo, canto ininteligível,
Co
Para uma sequência de letras de música com mais de uma palavra, por favor,
use uma única tag <lyrics/>para representar todas as <lyrics/>ininteligíveis.
5 l
48 tia
There are two ways to transcribe foreign speech: a tag to replace a
word or group of words you do not know and a span
tag to surround foreign words you can write down.
Use the foreign tag for speech in a language other than Portuguese which would
not be understood by Portuguese (BR) speakers.
tag para substituir uma palavra ou grupo de palavras que você não
conhece e um spam tag
estrangeiras que você pode escrever.
entre as palavras
50 id
Use o tag para fala em um idioma que não seja em português e que
não seria compreendido por falantes de português do Brasil.
Foreign Speech Palavras emprestadas, como "sayonara", devem ser transcritas da mesma
maneira que outras palavras em português.
nf
Examplo:
Um falante diz uma palavra estrangeira depois de “que” e você não
consegue identificar a palavra estrangeira
If there is more than one unintelligible foreign word in sequence, use a single tag.
If the entire sentence or unit cannot be understood and is in a foreign language,
Examplo:
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
O speaker diz “denken Sie an die Kinder“ no meio da frase mas você não
48 tia
entende
If you can understand the foreign language, please write the words down and
surround them with the span tag .
Examplo:
O speaker diz “denken Sie an die Kinder“ no meio da frase mas você não
entende
50 id
TRANSCRIÇÃO: eu pensei que ela disse <foreign>denken Sie an die
Kinder</foreign> e depois
nf
/!\ Tips:
● Remember that loanwords are words borrowed from other languages that
are widely known and understood by Portuguese speakers. They are not
considered foreign words for the purposes of this project and should not
receive a foreign tag.
Co
● Foreign names (people’s names, places, etc.) are not considered foreign
words and should be transcribed.
5 l
● If you can understand and transcribe what is said but it is not in
48 tia
Portuguese and not a loanword, please surround the words with
span tag.
/!\ Dicas:
20 ne ●
●
Lembre-se de que palavras emprestadas são palavras originárias de
outros idiomas que são amplamente conhecidas e compreendidas pelos
falantes de português. Elas não são consideradas palavras estrangeiras
para os fins deste projeto e não devem receber uma tag
● Se você não tiver certeza da grafia, mas entender a palavra e ela for
usada em seu idioma como uma palavra emprestada, faça uma pesquisa
Co
● Se você puder entender e transcrever o que está sendo dito, mas não
estiver em português e não for uma palavra emprestada, coloque as
palavras entre as span tags
5 l
Os números devem ser escritos por extenso da maneira como foram
48 tia
pronunciados.
Examplo
O número '2012' pode ser dito de muitas maneiras diferentes
Digits (e.g. 1 2 3 4 5 ...) can be used in the transcription ONLY when they are
Co
Example
Observe
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
● Xbox 360 ==>TRANSCRIÇÃO: Xbox trezentos e sessenta
Acronyms and initialisms are words made up of the first letters of words. They
may be pronounced as a word, or each letter may be pronounced separately.
Acronyms and initialisms are spelled using uppercase letters with no space or
period in between.
20 ne
Acronyms &
Initialisms
Acrônimos e siglas são palavras formadas pelas primeiras letras de outras
palavras. Eles podem ser pronunciados como uma única palavra ou cada letra
pode ser pronunciada separadamente. Acrônimos e siglas são escritos com
letras maiúsculas, sem espaço ou ponto entre elas.
Example
50 id
● N.A.S.A or N A S A ==> NASA
● U.S.A. or U S A ==> USA
● A.M / P.M. ==> AM / PM
● FIFA
● UNESCO
nf
When a speaker spells a word out, letter by letter, please transcribe uppercase
letters with a space in between.
Quando um speaker soletra uma palavra, letra por letra, por favor, transcreva as
letras maiúsculas com um espaço entre elas.
Co
5 l
48 tia
Example
20 ne
Inappropriate
language
IE.
Lista de Interjeições
FORMA CORRETA
SIGNIFICADO DE ESCRITA
Co
5 l
Interjeições de
48 tia
dor Ai!, Ui!, Ah!, Oh!,…
Nossa!, Cruz!,
Caramba!, Opa!,
Virgem!, Vixe!, Oh!,
Interjeições de Puxa!, Quê!, Ué!,
surpresa Barbaridade!,…
Diabo!, Puxa!, Pô!,
20 ne Interjeições de
impaciência
Interjeições de
silêncio
Raios!, Ora!, Irra!,
Hum!, Arre!,…
Psiu!, Silêncio!, Shh!,
Basta!, Chega!,…
50 id
Example
5 l
Span Tags (highlighting)
48 tia
There are two types of tags: span tags and event tags. Look for these in the screenshot below.
Event tags are inserted between words, while span tags are used to surround words.
To undo span tags, simply press backspace twice and the tag will be removed.
Existem dois tipos de tags: span tags e event tags. Procure por elas na captura de tela abaixo.
As tags de evento são inseridas entre palavras, enquanto as tags de intervalo são usadas para envolver
palavras.
20 n
Para desfazer as tags de intervalo, basta pressionar a tecla de retrocesso duas vezes e a tag será removida.
de dúvida, use a tag coloquial em vez de deixar uma palavra sem tag.
Examplo
Speaker's
Transcrição Full Form
Pronunciation
pra <colloquial>pra<colloquial> para
Porém, caso alguma palavra seja bem parecida com a palavra formal,
transcreva normalmente.
vamo → TRANSCRIÇÃO - vamos
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Use this to surround any words that were accidentally mispronounced. Spell
48 tia
the word in the normal (correct) way, then surround it. There is no need to
use this if someone has an accent — it should only be used when the person
accidentally said something the wrong way. When in doubt ask yourself
"would this person pronounce the word differently if I asked them to repeat
themselves?" If they would, it can be classified as a mispronunciation.
20 n
mispronunciation
e envolva-a com essa tag. Não há necessidade de usar isso se alguém tiver
um sotaque - deve ser usado apenas quando a pessoa disse algo
acidentalmente da maneira errada. Em caso de dúvida, pergunte a si mesmo:
"essa pessoa pronunciou a palavra de forma diferente se eu pedisse que eles
repetissem?" Se sim, pode ser classificado como uma pronúncia errada.
Examplo
O speaker falou ‘’que horas você está sabindo?’’
50 id
TRANSCRIÇÃO: que horas você está
<mispronunciation>saindo</mispronunciation>?
If you hear a word in the audio but you are not entirely sure how to spell it or
you are not entirely confident you are hearing the word correctly, surround the
nf
This tag might be needed if the speaker uses a proper name you are
unfamiliar with.
Do NOT use this tag for words you can easily spell correctly by doing a quick
online search.
Co
Please do not use the best guess tag if the speech is unintelligible because
best guess the audio quality is poor, the speaker mumbles, etc. for these cases please
Se você ouvir uma palavra no áudio, mas não tiver certeza de como
soletrá-la ou não tiver total confiança de que a ouviu corretamente, envolva a
palavra usando a tag "best_guess” (melhor palpite).
Essa tag pode ser necessária se o falante usar um nome próprio com o qual
você não esteja familiarizado.
Examplo:
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
● Você ouviu ‘’ ele me falou para ir em Wolengi” mas você não tem
48 tia
certeza como transcrever Wolengi; transcreva com o best_guess tag:
<best_guess>Wolengi</best_guess>
Por favor, não use a tag "best_guess" se a fala for ininteligível devido à
qualidade ruim do áudio, o falante murmurar, etc. Nestes casos, use a tag
20 ne NÃO use esta tag para palavras que você pode soletrar facilmente
corretamente fazendo uma rápida pesquisa online.
Examplo:
/!\ Lembre-se:
Se você ouvir algo em seu idioma, mas não conseguir entender a palavra =
use
Se você ouvir algo em uma língua estrangeira que não consegue entender =
Co
use
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Tagging non-speech noises and events
48 tia
These are listed in order of how often they are likely to be used. The more common tags are listed at the top of
the table.
Event Tag How to use it
Any pause of at least one second without speech should be tagged with the no speech tag.
Non-speech noises which are not within 1 second of speech do not need to be tagged.
20 ne Qualquer pausa de pelo menos um segundo sem speech deve ser marcada com o tag
.
Ruídos não relacionados à fala que não ocorram dentro de 1 segundo da fala não precisam
ser marcados.
Examplo
50 id
Você ouve um speech pontuada por uma tosse, seguida por uma pausa de 1
segundo e depois um barulho alto:
no speech /!\ If an entire unit does not contain any speech, it should be transcribed with one tag ONLY:
no speech tag. Even if it contains other sounds, you must ignore them if there is no speech
at all.
/!\ Se uma unit inteira não tiver nenhuma fala, ela deve ser transcrita com apenas um tag:
. Mesmo que contenha outros sons, você deve ignorá-los se não houver fala
Co
alguma.
Examplo
Toda a unidade contém alguém chorando, barulhos altos ou música instrumental:
The whole unit contains someone crying, loud noises or instrumental music:
TRANSCRIÇÃO:
Você deve ignorar todos os sons se não houver fala na unidade inteira.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Use for all sounds made by a foreground human which are not speech (e.g. any sounds from
48 tia
the mouth or nose, such as breath, cough, lipsmack, and laughing).
Use este tag para todos os sons produzidos por um humano em primeiro plano que não
sejam fala (por exemplo, qualquer som da boca ou nariz, como respiração, tosse, estalo de
20 ne spk
lábios e risadas).
Use for music (without lyrics) that does not overlap with foreground speech. Singing by a
speaker should be tagged as singing, not as music, while recorded music with lyrics should
Co
be tagged as lyrics.
Use para música (sem letras) que não se sobrepõe à fala em primeiro plano. O canto por um
music speaker deve ser marcado como canto, não como música, enquanto a música gravada com
letras deve ser marcada como lyrics.
5 l
Examplo
48 tia
Um locutor de notícias anuncia uma manchete antes de um jingle musical que
começa menos de um segundo após a última palavra ser pronunciada:
Você ouve um pouco de música, depois uma pausa sem qualquer som por mais de
um segundo e depois um speech. A música é ignorada porque está muito longe do
20 ne speech(mais de um segundo).
TRANSCRIÇÃO: eu te avisei!
Use for any foreground noise that is not spk or music (see above).
50 id
Do not tag background noise that is at a lower volume than speech.
Use para qualquer ruído feito por um ser humano em destaque que não seja fala ou música
nf
(consulte acima).
Não marque ruídos de fundo que estejam em um volume mais baixo do que a fala.
Examplo
Alguém bate forte na porta e menos de um segundo depois alguém fala:
TRANSCRIÇÃO: quem é?
Insert the speaker change tag at any point that the speaker changes. This may be at the
beginning of a unit or in the middle of a unit.
change-spk Speaker change tags only need to be used for speech or singing — tagged noises from a
different speaker do not require a speaker change tag.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
Insira a tag de sempre que houver uma troca de speaker. Isso pode ocorrer
no início de uma unidade ou no meio dela.
20 ne Exemplo
Um speaker em primeiro plano é respondido por outro locutor em segundo plano:
through a word). In a truncation, the recording has cut someone off while they were saying a
word. Therefore, truncations only occur at the start or end of a unit.
When you hear a truncation at the end of a unit and you can transcribe the word with
certainty, write out the truncated word in full followed by the tag. When you
Co
Use quando uma palavra é cortada no final de uma unit porque o computador não cortou o
truncation áudio corretamente. Isso é diferente de um fragmento (onde a pessoa para de falar no meio
de uma palavra). Em um truncamento, a gravação interrompeu alguém enquanto ele dizia
uma palavra. Portanto, os truncamentos ocorrem apenas no início ou no final de uma
unidade.
Quando você ouvir um truncamento no final de uma unidade e puder transcrever a palavra
5 l
48 tia
Exemplo
A palavra 'sofá' é dividida com "so-" no final da primeira unidade e "-fá" no início da
segunda unidade.
20 ne Se você não conseguir identificar qual é a palavra truncada no final de uma unidade,
Uma palavra é truncada entre duas units e você pode ouvir alguns fragmentos dela
nf
unit 2: no mercado
Co
If you come across user-identifiable information (UII), do not transcribe those words, and
insert this tag instead. The purpose is not to disclose a user's private information.
UII includes things like full names, usernames, gamertags, street addresses, telephone
numbers, credit card numbers, social security numbers, etc.
uii
There are exceptions. You do not need to mark UII if the information is public, e.g.:
5 l
● It is clearly a commercial promotion (e.g. an advertisement) with no expectation of
48 tia
privacy
● It is a public blogger broadcast
● The full name is of a well-known public figure (singer, writer, politician, athlete, etc.). A
well-known local public figure is also not marked as UII (e.g. a well-known teacher)
● It is not a full name (you hear either the first name or the surname).
20 ne /!\ Please use caution, full names mentioned in raffles/lucky draws should always be
marked as UII.
We have already removed most files that contain UII so you should not need to use this tag
often.
50 id
Se você se deparar com informações que possam identificar o usuário (UII), não transcreva
essas palavras e insira tag em vez disso. O objetivo não é divulgar informações
privadas do usuário.
UII inclui coisas como nomes completos, nomes de usuário, apelidos de jogadores,
nf
Há exceções. Você não precisa marcar UII se as informações forem públicas, por exemplo:
● É uma transmissão de notícias, programa de TV, programa de rádio ou TV.
● É claramente uma promoção comercial (por exemplo, um anúncio) sem expectativa
de privacidade.
Co
A maioria dos arquivos que contém o UII já foram removidos, então você não deve precisar
usar essa tag com frequência.
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
Punctuation
A sentence is a grammatically complete unit. A sentence will usually, but not always,
contain a subject (e.g. "the cat") and a verb (e.g. "sat"). Examples of grammatically
complete sentences which do not have a subject and verb include answers to questions
(e.g. "yes." and "no.") and exclamations ("what!" and "really?").
20 ne Uma sentença é uma unit gramaticalmente completa. Uma sentença geralmente, mas nem
sempre, contém um sujeito (por exemplo, "o gato") e um verbo (por exemplo, "sentou").
Exemplos de sentenças gramaticalmente completas que não têm um sujeito e um verbo
incluem respostas a perguntas (por exemplo, "sim" e "não") e exclamações ("o quê!" e
"sério?").
50 id
Examplo:
● TRANSCRIÇÃO: funcionando perfeitamente agora. eu poderia fazer mais? sim
talvez.
At the end of each sentence, use a period (.) for statements, a question mark (?) for
questions, or an exclamation mark (!) for exclamations. Do not use punctuation
nf
combinations ("?!", "!!!", "..."). Do not use hyphens or quotation marks to indicate quoted or
Punctuation mentioned speech. No other punctuation (such as : ;) should be used.
Only place punctuation at the end of a unit if the end of the unit is also the end of a
sentence. If the speaker continues the same sentence into the next unit, put the
punctuation wherever it naturally falls in the speech. See the description of a unit.
Co
No final de cada sentença, use um ponto (.) para declarações, um ponto de interrogação
(?) para perguntas ou um ponto de exclamação (!) para exclamações. Não use
combinações de pontuação ("?!", "!!!", "..."). Não use hífens ou aspas para indicar discurso
citado ou mencionado. Nenhuma outra pontuação (como :, ;) deve ser usada.
Coloque a pontuação apenas no final de uma unit se o final da unit também for o final de
uma sentença. Se o speaker continuar a mesma sentença na unit seguinte, coloque a
pontuação onde naturalmente se encaixa no discurso. Veja a descrição de uma unit.
Examplos:
● TRANSCRIÇÃO:
Unit 1: ganhar esse ano! o que você pensa
Unit 2: sobre o Knicks?
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
48 tia
See the "incomplete" tag section below for instructions about sentence fragments which
are not grammatically complete.
Consulte a seção "tag de incompleto" abaixo para obter instruções sobre fragmentos de
sentenças que não são gramaticalmente completos.
Insert the incomplete tag when a speaker begins a sentence and is either (a) interrupted by
a new speaker, or (b) begins a new sentence before the first grammatically complete
sentence is finished.
20 ne The tag should not be used to indicate that a sentence is continuing into a second unit.
Um speaker inicia uma frase, mas muda para uma nova frase antes de terminar a
primeira.
● TRANSCRIÇÃO: eu não sei se eles são muito conservadores a
respeito disso.
Co
You do not need to use the incomplete tag when the speaker restarts or repeats a single
word.
Você não precisa usar o tag quando o orador recomeça ou repete uma
única palavra.
You may use commas (,) to increase the readability, following standard rules surrounding
comma usage, for instance:
Commas ● For lists of items ("I ate two apples, three oranges, and a banana.") and sequences
of adjectives ("he was a big, red haired, evil man.")
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
● For introductory phrases ("so I was thinking, how do you do it?", "at the end of the
48 tia
day, what matters is your health.").
Please follow standard rules of comma usage. When unsure whether to use a comma, err
on the side of NOT using one.
Você pode usar vírgulas (,) para aumentar a legibilidade, seguindo as regras padrão que
envolvem o uso de vírgulas, por exemplo:
20 ne ●
●
Para listas de itens ("Eu comi duas maçãs, três laranjas e uma banana.") e
sequências de adjetivos ("ele era um homem grande, ruivo e mau").
Para frases introdutórias ("então eu estava pensando, como você faz isso?", "no
final do dia, o que importa é sua saúde.").
Por favor, siga as regras padrão de uso de vírgulas. Quando estiver em dúvida se usar
uma vírgula, é melhor NÃO usar.
50 id
nf
Co
NOTE: All information provided in this document is confidential. Any publication, provision, or
dissemination of this content is strictly prohibited. Do not share or post the contents on the
internet.
5 l
Resources
48 tia
● Pontuação da língua Portuguesa
● Interjeição
● Interjeição 2
● Letras maiúsculas e minúsculas - circunstâncias de uso
20 ne
50 id
nf
Co