Professional Documents
Culture Documents
Temas 4-5.
Temas 4-5.
Material complementario
• Excelente recurso para entender qué significan los corpus en el trabajo lingüístico:
Joaquim Llisterri (2007).
• Kennedy, Graeme (1998). An Introduction to Corpus Linguistics. Londres: Longman.
1.- Introduction; 1.1.- Corpora; 1.2.- The role of computers in corpus linguistics; 1.3.- The
scope of corpus linguistics; 2.- The design and development of corpora; 2.1.- Pre-electronic
corpora; 2.2.- Types of electronic corpora; 2.3.- Major electronic corpora for linguistic
research; 2.4.- Electronic text databases; 2.5.- issues in corpus design and compilation;
2.6.- Compiling a corpus; 2.7.- Organizations and professional associations concerned with
corpus design, development and research; 3.- Corpus-based descriptions of English; 3.1.-
Lexical descriptions; 3.2.- Grammatical studies centered on morphemes and words; 3.3.-
Grammatical studies centered on the sentence; 3.4.- Pragmatics and spoken discourse;
3.5.- Corpus-based studies of variation in the use of English; 4.- Corpus analysis; 4.1.-
Corpus annotation and processing; 4.2.- Procedures used in corpus analysis; 4.3.- Corpus
search and retrieval software; 5.- Implications and applications of corpus-based analysis; 5.-
Goals of linguistic description and the effect of corpora on methodology; Corpus linguistics
and computational linguistics; 5.3.- Corpus-based approaches to language teaching.
• Ejerhed, Eva; Church, Ken (1997). “Written Language Corpora”. En Cole, R. A. et al. (eds.).
Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge
University Press. 445-449.
• Arrarte, Gerardo (1999). “Normas y estándares para la codificación de textos y para la
ingeniería lingüística”. En Blecua, J. M. et al. (eds.). Filología e informática. Nuevas
tecnologías en los estudios filológicos. Barcelona: Milenio. 17-44.
• Sperberg-McQueen, C. M.; Burnard, Lou (eds.) (2002). TEI P4: Guidelines for Electronic
Text Encoding and Interchange. Text Encoding Initiative Consortium. XML Version: Oxford,
Providence, Charlottesville, Bergen.
• Biber, Douglas (1993). “Representativeness in corpus design”. Literary and Linguistic
Computing 8 (4). 243-257.
• Renouf, Antoinette (1987) "Corpus development". in SINCLAIR, J. (ed.). Looking Up. An
Account of the COBUILD Project. Birmingham: Collins. 1-40
• Torruella, Joan; Llisterri, Joaquim (1999). “Diseño de corpus textuales y orales”. En Blecua,
J. M. et al. (eds.). Filología e informática. Nuevas tecnologías en los estudios filológicos.
Barcelona: Milenio. 45-77.
• Barnbrook, Geoff (1996). Language and Computers. A Practical Introduction to the
Computer Analysis of Language. Edinburgo: Edinburgh University Press.
1.- Why use a computer; 2.- First capture your data; 3.- Examining the catch: using
frequency lists; 4.- Studying the environment: using concordances; 5.- The sociology of
words: collocations; 6.- Putting them in their place: tagging, parsing and so on; 7.- The
leading edge: applications of natural language processing; 8.- Case studies.
• Pérez Guerra, Javier (1998). Análisis computarizado de textos. Una introducción a TACT.
Vigo: Universidade de Vigo.
Parte I. Introducción a la lingüística de corpus; 1. Introducción. Los corpus y la lingüística;
2. Historia de la lingüística de corpus; 3. Concepto de "corpus de textos". Hacia el corpus
electrónico; 3.1 Introducción; 3.2 Tamaño del corpus; 3.3 Rigor en la selección del material;
3.4 Codificación de los textos; 4. Anotaciones en los corpus; 4.1 Introducción; 4.2
Categorías de anotación; 4.3 COCOA: la versatilidad al servicio de la simplificación; 4.4
Hacia el estándar de la anotación textual: SGML-TEI; 4.5 De SGML a TDB: una
introducción a SGML2TDB; 5. Creando nuestro corpus informatizado: computarizando el
texto. Parte II. Introducción al análisis textual asistido por ordenador: TACT; 1. Introducción;
Diccionarios e informática
Bloque 2. Fuentes y corpus