02 Hui Chuan Lu

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

volumen 3 ao 2008

EL ESTUDIO DE LAS ETAPAS DEL APRENDIZAJE LXICO BASADO EN EL CATE-CIC


Hui-Chuan Lu N atio nal Che ng K ung U niv e rs ity

Resumen: T omand o c omo b as e el C orp us d e A p rend ic es T aiw anes es d e E s p aol, c read o p or L u, y utiliz and o los ins trumentos analtic os es p ec fic os d e c orp us , h emos p retend id o es tud iar el d es arrollo l x ic o d e los es tud iantes q ue ap rend en el es p aol c omo s eg und a leng ua ex tranjera. N os h emos c entrad o en el c otejo d e las p alab ras c omb inatorias emp lead as en d is tintos niveles d e ap rend iz aje y p rop ues to un c ontinum en lo q ue s e refiere al g rad o d e fac ilid ad d el p roc es o d e ap rend iz aje, q ue s era el s ig uiente: V - P rep - V /N - P rep - N , V - C onj, V - A d v/V - N , N - A d j, V - A d j, A d j- N , N - V , D et- N . A d em s , no s lo nos p erc atamos d e q ue en las etap as d e ap rend iz aje, ex is te un ord en d e fac ilid ad a d ific ultad q ue va d es d e el tip o otorg r fic o h as ta el g ramatic al y el l x ic o; s ino q ue tamb i n es p ec ific amos q ue la d ific ultad d el s entid o s em ntic o ap arec e en una etap a m s tard a q ue el voc ab ulario c on res p ec to al tip o l x ic o d e las p alab ras c omb inatorias . Palabras clave: c orp us , l x ic a, interleng ua. Abstract: Taking the base of the Corpus of Taiwanese Learners of Spanish, created by Lu, and applying as special analytical instruments, weve tried to study the lexical development of the students learning Spanish as second foreign language. Weve focused on the comparison of the combination of words used in different levels of learning in which we proposed a continuum for the degree of learnablity form the easiest to the most difficult as follows VPrep-V/N-Prep-N, V-Conj, V-Adv/V-N, N-Adj, V-Adj, Adj-N, N-V, Det-N. Moreover, we not only derived, in the developmental stages of learning, an order from early stage to late stage exists that comes from the orthographic type to the grammatical and then to lexical types; but we also identified that the semantic meaning appears in a stage later than the vocabulary with regard to the lexical type of the combinative words. Key Words: corpus, lexical, interlanguage.

1. INTRODUCCIN
L os c orp us s e h an c onvertid o en una fuente imp ortante p ara c as i tod os los es tud ios relac ionad os c on la ling s tic a, aunq ue s u influenc ia y los res ultad os p os teriores p ued en s er d iferentes d ep end iend o d e los id iomas a los q ue s e refiera. E l p res ente p ers ig ue d os ob jetivos fund amentales : p or una p arte, la c ons truc c i n d el p rimer c orp us d e los es tud iantes q ue ap rend en otra leng ua ex tranjera d iferente al ing l s ; y p or otra p arte, el es tud io d e las etap as d el d es arrollo d e la interleng ua p ara el c amp o l x ic o d e la ling s tic a. E l p rop s ito d e c omb inar la c ons truc c i n d e un c orp us d e los es tud iantes y s u ap lic ac i n en el an lis is l x ic o es d emos trar c mo p ued e s er efic az y d e g ran alc anc e la metod olog a b as ad a en el c orp us p ara los es tud ios d e la ling s tic a ap lic ad a. E l d es arrollo d e los c orp us relac ionad os c on los id iomas ex tranjeros , c on ex c ep c i n d e ing l s , h a s id o lento d e forma q ue el n mero d e c orp us es p aoles ex is tentes es muy limitad o;

R evis ta d e L ing s tic a y L eng uas A p lic ad as . IS S N : 1886- 2438

| 17

d os ejemp los s eran el C E D E L 2 (C orp us E s c rito d el E s p aol L 2) y el c orp us d e los es tud iantes jap ones es d el es p aol. S in emb arg o, un 21.4% d e las inves tig ac iones q ue s e relac ionaron c on la ling s tic a ap lic ad a s e realiz aron en T aiw n a p artir d e las red ac c iones d e los es tud iantes rec og iend o y us and o d atos ind ivid ualmente, p ero s in c ons id erar la p os ib ilid ad d e us o p b lic o (d e tales rec urs os valios os ) med iante una p ues ta en c om n. P or lo tanto, d es d e nues tro p unto d e vis ta, ex is te la nec es id ad imp erios a d e la c reac i n d el c orp us d e los es tud iantes taiw anes es d el es p aol (C A T E : C orp us d e A p rend ic es T aiw anes es d e E s p aol). A d em s , b as nd onos en el an lis is d e los d atos ex trad os d el c orp us elab orad o p or los es tud iantes y teniend o en c uenta la frec uenc ia d e ap aric i n y ex aminand o las relac iones es tad s tic as , d emos traremos c mo un c orp us p ued e s er d e g ran utilid ad p ara arrojar luz s ob re las etap as d el d es arrollo d e d ivers os niveles d e es tud iantes en d ivers os s ub c amp os d e la ling s tic a, tales c omo el l x ic o (la c oloc ac i n y la c olig ac n). E n d efinitiva, la ap ortac i n p rinc ip al d e es te trab ajo s er la c reac i n d el p rimer c orp us d e los es tud iantes taiw anes es d el es p aol. A d em s , p rop onemos mod elos d e an lis is d e los d atos ex trad os d el c orp us c ons truid o c on el fin d e p rop orc ionar un mues trario ob jetivo y rep res entativo d el d es arrollo d e la ad q uis ic i n d e la leng ua p or p arte d e los es tud iantes .

2 . E S TUDIOS P RE CE DE NTE S
2 .1 . Co ns truc c i n d e c o rp us d e e s tud iante s
E n lo c onc erniente a los es tud iantes d el ing l s , c ab e s ealar la ex is tenc ia d e los s ig uientes c orp us : el IC L E (C orp us internac ional d el ing l s d e los es tud iantes ), el d e L ong man, el d e C amb rid g e1 y M ontc lair 2 (la b as e d e d atos elec tr nic a d e los alumnos d e la leng ua d e M ontc lair). E n T aiw n, ex is ten los s ig uientes c orp us d e los es tud iantes d e la leng ua ing les a: el c ons tituid o p or C oleman B ernath en la U nivers id ad S ooc h ow , el d e N T O U (el C orp us d e los es tud iantes taiw anes es E F L , q ue c ontiene 53.000 p alab ras y fue c ons tituid o p or H au- ran C h en en N T O U ), y el T L C E c ons tituid o p or la p rofes ora S h ih d e la U nivers id ad N ac ional S u- Y et- S h en (s e trata d el c orp us m s rep res entativo d e T aiw n d e los d e es tud iantes d e ing l s y es t b as ad o en un s is tema d e etiq uetas ). A d em s , E N G L IS H T L C 3, s e trata d e un c orp us ing l s elec tr nic o d e los es tud iantes taiw anes es c on un s is tema q ue p ued e d etec tar los errores . E n C h ina, enc ontramos el c orp us d e los es tud iantes c h inos d el ing l s 4 (1.000.000 d e p alab ras ), c read o p or G ui S h ic h un d el d ep artamento d el id ioma ex tranjero en la U nivers id ad G uang D ung . A d em s , ex is te el c orp us M E T (400.000 p alab ras ) q ue fue c ons tituid o p or H e A np ing d e la U nivers id ad M erid ional N ac ional d e C h ina, as c omo el c orp us d el ing l s d e los es tud iantes 5 (25.000.000 d e p alab ras ) fund ad o p or J . M ilton, q ue c ontiene etiq uetas d e las c ateg oras g ramatic ales y d e los errores . S i atend emos a otros id iomas ex tranjeros d iferentes al ing l s , el d es arrollo d e los c orp us d e los es tud iantes jap ones es 6 h a llamad o muc h o m s la atenc i n en A s ia, p or ejemp lo, el c orp us d e los es tud iantes jap ones es c read o p or la U nivers id ad N ac ional C h eng K ung en T aiw n. S in
1 2 3 4 5 6

h ttp h ttp h ttp h ttp h ttp h ttp

://leo.meik ai.ac .jp /~ tono/lc orp us lis t.h tml ://c h s s .montc lair.ed u/ling uis tic s /M E L D / ://mail.tk u.ed u.tw /d w ib le/ind ex .h tm ://nora.h d .uib .no/c orp ora/1997- 1/0262.h tml ://leo.meik ai.ac .jp /~ tono/lc orp us lis t.h tml ://140.116.245.232/jap an_ c orp us

18 |

R evis ta d e L ing s tic a y L eng uas A p lic ad as

volumen 3 ao 2008

emb arg o, enc ontramos un n mero muy red uc id o d e c orp us es tab lec id o p or es tud iantes d e la leng ua es p aola, p or ejemp lo: (1) el C orp us E s c rito d el E s p aol L 2 (C E D E L 2)7 q ue rec op ila trab ajos es c ritos d e los p rinc ip iantes q ue ap rend en el es p aol c omo s eg und a leng ua, y (2) un s ub - c orp us d el C orp us Internac ional d e los es tud iantes d e ing l s - IC L E c read o p or J oA nne N eff d e la U nivers id ad C omp lutens e en M ad rid , y (3) C orp us jap on s d e los es tud iantes d el es p aol8 .

2 .2 . E s tud io s a p artir d e lo s c o rp us d e e s tud iante s


E ntre los es tud ios g enerales b as ad os en los c orp us d e los alumnos p od emos menc ionar las ap ortac iones d e los s ig uientes autores : G rang er (1998), N eff (2004) y M nnink et al. (2000), entre otros . P or ejemp lo, M nnink et al. analiz a los errores d e la s intax is d e los es tud iantes us and o el s is tema d e las etiq uetas d e IC L E . C on res p ec to al an lis is d e los d atos ex trad os d e los c orp us d e los es tud iantes c h inos d el ing l s c ab e menc ionar: H uang (2000), C h uang (1996), W ang (1999), F low erd ew (2006), etc . P or ejemp lo, F low erd ew trata d e las c las ific ac iones d e los errores b as ad as en los c orp us d e los es tud iantes c antones es d el ing l s . E s tos es tud ios p rec ed entes p rop orc ionan una c onc lus i n g eneraliz ad a y rep res entativa med iante el an lis is p ormenoriz ad o d e una g ran c antid ad y varied ad d e d atos .

2 .3 . E s tud io s re lac io nad o s c o n la inte rle ng ua


E n lo referente a las inves tig ac iones relac ionad as c on la interleng ua, K its nk i (2006) p rop one q ue el an lis is b as ad o en los c orp us d e los es tud iantes y en los es tud ios d e la interleng ua p ued e ay ud ar a d etec tar los tip os d e errores as c omo las c arac ters tic as d e la interleng ua d es arrollad a p or los es tud iantes . C ob b (2003) p rueb a q ue la rec op ilac i n d e d atos b as ad os en los c orp us fac ilita el res ultad o d e la inves tig ac i n en el ap rend iz aje d e s eg und as leng uas . L iang (2006) ap lic a las etiq uetas d e las c ateg oras g ramatic ales d e C L A W en el an lis is d e las red ac c iones d e los es tud iantes c h inos d el ing l s p ara reforz ar el es tud io d e la interleng ua. A d em s , L is i (2001) inves tig a las etap as d es arrollad as p or los es tud iantes es p aoles d el ing l s a p artir d e un c orp us q ue c ontiene una g ran c antid ad d e d atos . T amb i n, G onz alez - E s p res ati (2002) ex p lor la interleng ua c omp arand o y analiz and o errores c ometid os p or los es tud iantes es p aoles d el p ortug u s y los es tud iantes p ortug ues es d el es p aol. P or otra p arte, A lex op oulou (2005) analiz a la interleng ua p ara c ons truir errores s int c tic os d e la ex p res i n es c rita d e los es tud iantes es p aoles d el g rieg o. A d em s , N eff et al. (2003) c omp ara el ing l s d e los h ab lantes nativos y el d e los es tud iantes e ind ic a q ue los es tud iantes us an d emas iad o o d emas iad o p oc o los verb os aux iliares . A ijmer (2004) c omp ara las d iferenc ias d e los us os d e la interleng ua entre los es tud iantes s uiz os y los h ab lantes nativos d el ing l s . S e as ume q ue la raz n p rinc ip al d e los errores q ue c ometen los es tud iantes tiene q ue es tar relac ionad a c on la leng ua materna d e los es tud iantes . P or ejemp lo, el error d e la c onjunc i n ing les a s e relac iona c on la leng ua nativa d e los es tud iantes (T s eng y L iou, 2006). S eg n el an lis is d e los d atos en los c orp us d e los trab ajos es c ritos d e los es tud iantes rab es d el ing l s y s eg n el C orp us L ouvain d e ens ay os d e los nativos ing les es (A l- B toos h , 2005) p od emos d ec ir q ue los trab ajos es c ritos es t n m s c erc a d el us o d e s u leng ua natal.
7 8

h ttp ://w w w .uib .no/mailman/p ub lic /c orp ora- arc h ive/2006- J une/002850.h tml Y . K amak ura (2005)

R evis ta d e L ing s tic a y L eng uas A p lic ad as . IS S N : 1886- 2438

| 19

3 . CA TE
3 .1 . CA T E 2 0 0 5 -2 0 0 6

3 .1 .1 . La e s truc tura
E n p rimer lug ar, q ueremos ag rad ec er el ap oy o financ iero d e N S C (N S C 93- 2411- H - 006- 022, N S C 94- 2411- H - 006- 016 y N S C 95- 2411- H - 006- 012) q ue nos h a fac ilitad o la c reac i n d el c orp us . A d em s , d amos las g rac ias es p ec ialmente a los es tud iantes q ue nos h an p rop orc ionad o s us red ac c iones , as c omo a los p rofes ores d e la U nivers id ad c at lic a d e F u J en, la U nivers id ad d e T amk ang , la U nivers id ad d e P rovid enc e, el C oleg io univers itario d e W enz ao U rs uline d e los id iomas , la U nivers id ad N ac ional d e T aiw n, la U nivers id ad N ac ional d e C h eng c h i, la U nivers id ad d e N anH ua, la U nivers id ad C h ina d e U ltramar d e la T ec nolog a, la U nivers id ad N ac ional d e F ormos a, la U nivers id ad N ac ional d e C h iay i, y la U nivers id ad N ac ional d e C h eng K ung p or ay ud arnos a rec og er los trab ajos 9. E n nues tros p lanes futuros , c on la intenc i n d e amp liar el C A T E (C orp us d e A p rend ic es T aiw anes es d e E s p aol), s eg uiremos rec op iland o d atos d e los es tud iantes taiw anes es d el es p aol med iante un p roc ed imiento q ue c ons is tente en rec og er, c orreg ir, introd uc ir y p rog ramar los d atos d e las red ac c iones . A mp liaremos s is tem tic amente la c antid ad d el c orp us ao tras ao p or med io d e la rec og id a d e 500 a 1000 red ac c iones c ad a ao p ara c ons eg uir el ob jetivo final q ue p retend emos : q ue el C A T E s ea el c orp us m s g rand e c ons truid o en T aiw n. C on vis tas a c omp artir es tos rec urs os , tod os los autores d e las red ac c iones h an firmad o las c artas d e c ons entimiento y h an es tad o d e ac uerd o en q ue s us trab ajos s e p ud ieran es tud iar p or el p b lic o en g eneral en un futuro. E n c uanto al c riterio d e c reac i n, el C A T E s ig ue alg unos p rinc ip ios d e la c ons truc c i n d e un c orp us , p retend iend o s er rep res entativo, tener d ivers id ad y tener b alanc e. A c tualmente, h emos ac ab ad o el trab ajo es truc tural d e los p rimeros d os aos (2005- 2006). L as fuentes d e las q ue p roc ed en los d atos d el c orp us c ons is ten en d os g rup os d e es tud iantes : (1) en nues tro p rimer g rup o, los es tud iantes d el d ep artamento d el E s p aol d e c uatro univers id ad es taiw anes as s on los q ue nos van a p rop orc ionar la rec og id a d e d atos , inc luy end o el s ig uiente n mero d e es tud iantes : 10 d e la U nivers id ad c at lic a d e F u J en, 59 d e la U nivers id ad d e T amk ang , 88 d e la U nivers id ad d el P rovid enc e, y 43 d el C oleg io univers itario d e los id iomas d e W enz ao U rs uline d el ao 2005. A d em s , 89 d e la U nivers id ad d e T amk ang , 144 d e la U nivers id ad d el p rovid enc e, y 192 d el C oleg io univers itario d e W enz ao U rs uline d e 2006 s on tamb i n ob jeto d e nues tro an lis is . (2) T amb i n rec og emos los d atos d e los es tud iantes es p aoles d e los d ep artamentos d e id iomas ex tranjeros q ue c ons tituy en el s eg und o g rup o, los d ep artamentos d e leng uas ex tranjeras y el d ep artamento d e la ed uc ac i n g eneral, inc luy end o el s ig uiente n mero d e es tud iantes : 59 d e la U nivers id ad N ac ional d e T aiw n, 42 d e la U nivers id ad N ac ional d e C h eng c h i, 26 d e la U nivers id ad N ac ional d e C h iay i, 84 d e la U nivers id ad N ac ional d e C h eng K ung , 9 d e la U nivers id ad N ac ional d e K aoh s iung , 18 es tud iantes d e la U ni9

A g rad ec imientos es p ec iales a la c olob orac i n d e los P rofes ores V ic torian T ian, R ita H e, A ilin Y en, F ranc is c o M oreno, L uc a L uo, D elia L in, T eres a C h en, J avier L u, L aura V ela, E d elmira M ao, C ec ilia L iu, A z uc ena L in, E ug enio B orao, S ofa Y ang , C arolina L in, C amilo W ang y E milia C h en.

20 |

R evis ta d e L ing s tic a y L eng uas A p lic ad as

volumen 3 ao 2008

vers id ad d e D a- Y eh , y 21 d e la U nivers id ad d e T ok o d el ao 2005. A d em s , inc luimos a 93 d e la U nivers id ad N ac ional d e T aiw n, a 36 d e la U nivers id ad N ac ional d e C h eng c h i, a 79 d e la U nivers id ad nac ional d e C h eng K ung , a 14 d e la U nivers id ad d e N anH ua, a 16 d e la U nivers id ad nac ional d e C h iay i, a 14 d e la U nivers id ad C h ina d e U ltramar d e la T ec nolog a, y a 13 d e la U nivers id ad N ac ional d e F ormos a d el ao 2006. E n total, los trab ajos d e los es tud iantes d e es tas univers id ad es alc anz an la c ifra d e 1.058 red ac c iones y d e 209.486 p alab ras .

3 .1 .2 . CA T E -CIC: E l c o rp us d e ap re nd ic e s taiw ane s e s d e e s p a o l-c o ntras te e ntre inc o rre c c i n y c o rre c c i n


A trav s d e la introd uc c i n d e la vers i n c orreg id a d e los errores revis ad os p or los h ab lantes nativos d el es p aol y d e la ap lic ac i n d e la func i n K W IC (K ey w ord s in C ontex t) d e la C onc ord anc ia p od emos ob tener las p alab ras c lave o s us es truc turas , en las c uales los inves tig ad ores o los es tud iantes es t n interes ad os . C on la rec up erac i n d e las p alab ras c lave, la p antalla d el ord enad or es t d ivid id a en d os p artes , en una d e ellas mues tra la orac i n orig inal c on errores y la otra la orac i n c orreg id a, c omo s e mues tra en la s ig uiente imag en.

A ntes d e aad ir las func iones d e c ontras te d e errores y la c orrec c i n, los inves tig ad ores p ued en s olamente c ons ultar el C E T E p ara rec up erar los res ultad os d el us o d e los es tud iantes y p rep arar los materiales d id c tic os . E n el c as o d e q uerer h ac er an lis is m s p rofund os , d eb er n h ac erlo los p rop ios inves tig ad ores s in la ay ud a d e K W IC d eb id o a s us limitac iones . P or otra p arte, los es tud iantes tamp oc o s e b enefic iar n muc h o d e la c ons ulta d el c orp us orig inal. D es p u s d e s er aad id a la h erramienta d e c ontras te d el error y c orrec c i n, los inves tig ad ores no s lo rec up eran los d atos us ad os p or los es tud iantes d el es p aol, s ino q ue tamb i n p ued en c omp ararlos c on las formas c orreg id as , o s ea, c on el us o d e los h ab lantes nativos d el es p aol. S imult neamente, los es tud iantes tamb i n p od r n b enefic iars e med iante las c ons ul-

R evis ta d e L ing s tic a y L eng uas A p lic ad as . IS S N : 1886- 2438

|21

tas d e las c orrec c iones q ue s e c orres p ond en c on las eq uivoc ac iones c ometid as p or ellos mis mos o s us c omp aeros d e c las e. E n los p rimeros d os aos d e la c ons truc c i n d el C A T E , c ien red ac c iones h an s id o c omp arad as c on las formas c orreg id as p or un p rofes or es p aol nativo y marc ad as c on etiq uetas q ue ind ic an: los tip os d e errores y las p artes d e la orac i n en las q ue s e h an c ometid o los mis mos . S ealand o y anotand o los errores d e los es tud iantes c on etiq uetas , p onemos al d a las c arac ters tic as t c nic as d el C A T E y p rop orc ionamos func iones m s avanz ad as p ara la b s q ued a en el c orp us y el an lis is d e los errores p or p arte d e los inves tig ad ores y d e los alumnos . E n c onc lus i n, el n mero d e p ers onas q ue p ued en b enefic iars e s e h a amp liad o notab lemente.

3 .2 . Las func io ne s t c nic as

3 .2 .1 . V e rs i n d e l w e b -s ite d e CA T E 2 0 0 5 -6
E l C A T E s e d ivid e p rinc ip almente en c uatro s ub s is temas : (1) interfaz d e la rec op ilac i n, (2) c reac i n d el nd ic e, (3) p reg unta y (4) s is tema d e entrad a. E l leng uaje d e p rog ramac i n p ara la rec op ilac i n d el c orp us es P erl y M y S Q L p ara la b as e d e d atos . P ara q ue es te rec urs o s ea m s manejab le p or p arte d e los us uarios s e h a d ec id id o q ue la interfaz p os ea la ap arienc ia y la es truc tura d e una p g ina w eb .

3 .2 .1 .1 . Inte rfaz d e la c o le c c i n
D eb id o a la varied ad d e autores y d e fuentes d e las q ue s e h a s urtid o es te trab ajo d e inves tig ac i n, es p eramos q ue al trans c irb ir las red ac c iones , tod os los arc h ivos res p eten las s ig uientes normas : (1) el c d ig o d e la unid ad y (2) las formas d e la unid ad . (1) C d ig o d e la unid ad C omo los us uarios p ued en utiliz ar d iferentes c d ig os en s us red ac c iones , s e d eb e utiliz ar el mis mo c d ig o d urante el p roc es o d e rec op ilac i n, d e lo c ontrario s e p od ra p rod uc ir una g ran c onfus i n en el nd ic e. P or ejemp lo, en el c as o d e as ig nar el c d ig o p ara la p alab ra c on ac ento s lo, nic amente p ued e s er U T F - 8 o IS O , p orq ue en el c as o d e no us ar el mis mo c d ig o p os teriormente, el p rog rama d is ting uir la mis ma p alab ra s lo c omo d os p alab ras d iferentes . A s q ue c ons tituimos un c d ig o d e la unid ad med iante la func i n d e la c od ific ac i n d el w eb b row s er. D e es ta manera, los us uarios c op ian las red ac c iones al C G I, y el b row s er las trans forma en el c d ig o q ue nec es itamos p ara evitar el inc onveniente d e es c rib ir el p rog rama d e trans formac i n. A c tualmente, el s is tema utiliz a U T F - 8 p ara trans c rib ir y c ons ultar. (2) F ormas d e la unid ad C omo c ons ec uenc ia d el emp leo d e d iferentes c onc ep tos p ara efec tuar la c ons ulta (p or ejemp lo, s e p ued en c ons ultar temas , autores ...), s urg e la nec es id ad d e d otar a los d atos d e unas d eterminad as formas q ue ap orten unid ad y q ue fac iliten el m tod o d e c ons ulta. P ara d otar a es te trab ajo d e una forma d e unid ad res ulta c onveniente c rear la b as e d e d atos b as nd onos en las c arac ters tic as d e la c ons truc c i n.

22 |

R evis ta d e L ing s tic a y L eng uas A p lic ad as

volumen 3 ao 2008

3 .2 .1 .2 . Cre ac i n d e l nd ic e
E l nd ic e es uno d e los elementos m s imp ortantes q ue c ons tituy en el s is tema d e c ons ulta. L a func i n d el nd ic e es la d e rec ord ar la p os ic i n en la q ue p od emos loc aliz ar c ad a p alab ra. U s and o el s is tema d e c ons ulta, p od emos enc ontrar r p id amente las red ac c iones q ue c ontienen p reg untas . A c tualmente, g uard amos el nd ic e en la b as e d e d atos d e M y S Q L , c omo s e mues tra en la s ig uiente imag en. C ab e s ealar q ue ex is ten muc h as maneras d e g uard ar un nd ic e, p ero nos otros h emos c ons id erad o q ue el q ue m s ay ud a a nues tro p rop s ito es el nd ic e invertid o. U n ejemp lo d el nd ic e invertid o s era el s ig uiente: s up onemos q ue h ay d os red ac c iones : la D 1 y la D 2, los d atos es taran reg is trad os en el nd ic e invertid o.

3 .2 .1 .3 . Inte rfaz d e c o ns ulta


E l s is tema d e la interfaz p ermite a los us uarios realiz ar la c ons ulta p ara enc ontrar un d eterminad o rec urs o. A d em s d e la c ons ulta b s ic a, tamb i n ex is ten otras op c iones es p ec fic as d e b s q ued a, p or ejemp lo: h oras d e ap rend iz aje, los d ep artamentos d e los autores , temas , etc ., c omo s e s eala en la s ig uiente imag en.

R evis ta d e L ing s tic a y L eng uas A p lic ad as . IS S N : 1886- 2438

|23

3 .2 .1 .4 . S is te m a d e intro d uc c i n
P ara evitar la p os ib ilid ad d e q ue los us uarios p ued an d aar el s is tema, d eb e h ab er un mec anis mo d e id entific ac i n c on el ob jetivo d e p roteg er el s is tema. A c tualmente, s e p ermite la entrad a en el s is tema a los us uarios q ue es t n d eb id amente autoriz ad os .

3 .2 .2 . V e rs i n d e no -s itio -w e b
C on res p ec to a la vers i n d e no- w eb - s ite, vamos a d emos trar c mo p od emos c onfec c ionar un c orp us y analiz ar d atos efic ientemente, c on la menor ay ud a p os ib le d e ing enieros p rofes ionales en la ling s tic a c omp utac ional. E s d ec ir, nos b enefic iamos d e las ventajas d e las tres func iones p rinc ip ales p rop orc ionad as p or la h erramienta d el an lis is l x ic o, la c uarta vers i n d e W ord S mith (p rog ramad a p or M ik e S c ott), a s ab er, W ord L is t, C onc ord y K ey W ord s . L a may or d ific ultad c on la q ue nos h emos top ad o es la d e es tab lec er un s is tema d e la c od ific ac i n. U s and o las h erramientas d is p onib les p ara analiz ar los d atos g uard ad os en los arc h ivos c on el formato d el tex to p uro (arc h ivo.tx t), nec es itamos p res tar la atenc i n al s is tema d e c od ific ac i n. D es p u s d e inves tig ar varios c orp us c read os y s oftw are ap lic ad os , c onc luimos : p or un lad o, q ue el p rob lema d e la c od ific ac i n s e h a p rod uc id o p orq ue los s is temas d e c od ific ac i n menc ionad os interac c ionan y entran en c onflic to c on los s is temas d e los c d ig os q ue utiliz a M ic ros oft. M enc ionamos es ta d ific ultad p orq ue nunc a h ab an s id o c ontemp lad as en ning n manual d e ins truc c i n. M ientras q ue, p or otro lad o, las h erramientas s e p ued en utiliz ar p ara es tud iar d atos es p aoles s in ning n p rob lema b ajo la vers i n ing les a o la es p aola d e M ic ros oft O ffic e. T eniend o en c uenta nues tras ex p erienc ias p revias c on W ord S mith , tenemos la p os ib ilid ad d e ap lic ar el s is tema d e c od ific ac i n d el IS O p ara rec onoc er las letras es p ec iales en es p aol, , , , , , , , ap lic nd olo al s is tema c h ino d e W ind ow s .

4 . E S TUDIO DE L A S E TA P A S DE L DE S A RROL L O
4 .1 . P ro p s ito y c ue s tio ne s q ue s e p lante an e n e s te e s tud io
E l p rop s ito d el p res ente es tud io c ons is te en d es arrollar un ord en jer rq uic o d e ap rend iz aje a trav s d el an lis is d e los errores c ometid os p or los es tud iantes en lo referente a los us os d e las p alab ras c omb inatorias . P artiend o d e es ta b as e, la p reg unta fund amental q ue s us c ita el p res ente es tud io es la s ig uiente: c u les s on las c ateg oras d e las p alab ras c omb inatorias en las c uales c ometen m s errores los es tud iantes y c u les s on las d iferenc ias entre d is tintas etap as d el ap rend iz aje? .

4 .2 . E s tud iante s : CA T E -CIC


E n p rimer lug ar, d ivid imos a los es tud iantes en d os niveles : nivel I y nivel II, q ue s e c orres p ond en c on los q ue llevan 128 h oras es tud iand o el es p aol y los q ue h an ap rend id o el es p aol d urante 256 h oras res p ec tivamente. L a manera d e c ontar las h oras d e ap rend iz aje eq uivale a: 3 h oras /s emana x 16 s emanas /s emes tre x 2 s emes tres /ao x N ao. D el nivel I, rec og imos 37 red ac c iones , 530 orac iones y 10.432 p alab ras en total (6.193 p alab ras d is tintas ); mientras q ue en el nivel II, s lo reg is tramos 18 red ac c iones , 240 orac iones y 8.282 p alab ras (5.183 d is tintas p alab ras ).

24 |

R evis ta d e L ing s tic a y L eng uas A p lic ad as

volumen 3 ao 2008

L os temas d e las red ac c iones d el nivel I s on d iferentes , p or ejemp lo: E l fin d e s emana , U n d a en la univers id ad , L os d as es p ec iales d e la p as ad a s emana , E l fin d e s emana p as ad o , L a mirad a nueva d e nues tra h ab itac i n , L as c os as imp ortantes p ara m , U n p as eo en b ic ic leta p or la tard e , E l verano p as ad o , U na tard e en la univers id ad , L a fies ta p ara 2005 , E l d a d e final d e ao 2004 , L as vac ac iones d el verano p as ad o , etc . P or otro lad o, los temas d el nivel II inc luy en: U na c omp aric i n d e las familias en C h ina y en J ap n , U n viaje s olo , M i ex p erienc ia d e la ed uc ac i n en T aiw n , L a g ente d e T aip ei , C onflic to y c oord inac i n d el R omantic is mo y la R ealid ad , Q uerer es P od er , etc .

4 .3 . M e to d o lo g a
P ara c ontes tar a las p reg untas q ue s e p lantean en es te es tud io, analiz aremos los d atos ex traid os d el C E T E - C IC anot nd olos c on etiq uetas d e errores y P O S (las p artes d e la orac i n) c on el ob jetivo d e fac ilitar la p res ente inves tig ac i n c on la finalid ad fund amental d e ap rovec h ar las h erramientas d e c orp us ex is tentes . E n p rimer lug ar, c las ific amos los errores c ometid os p or los es tud iantes en tres g rup os : el g ramatic al, el l x ic o y el ortog r fic o. L os errores g ramatic ales c ons is ten en la c onc ord anc ia, el p ronomb re reflex ivo, el verb o (forma, tiemp o, mod o) entre otros . L os errores l x ic os inc luy en el voc ab ulario, la c ons truc c i n, el s entid o, el frag mento. Y p or ltimo, los errores ortog r fic os es t n c omp ues tos p or la p untuac i n, el ac ento, etc . A c ontinuac i n, las p artes d e la orac i n d ond e s e c ometen los errores s e d ivid en en oc h o c ateg oras p rinc ip ales : el s us tantivo, el ad jetivo, el p ronomb re, el verb o, el ad verb io, la p rep os ic i n, la c onjunc i n y la interjec c i n. S eg n los res ultad os ob tenid os , p od emos es tab lec er los s ig uientes rd enes jer rq uic os en func i n d e la c antid ad d e errores c ometid os . P ara el nivel I, el ord en d es d e lo m s d ifc il a los m s f c il es : D et- N (89), N - V (82), P ron- V (66), A d j- N (48), V - A d j (44), N - A d j (36), V - A d v (33), V - N (12), V - C onj (12),V - P rep - V (8), N - P rep - N (5). P or otro lad o, p ara el nivel II, el ord en d e d ific ultad es : D et- N (113), N - V (87), A d j- N (69), V A d j (61), P ron- V (56), N - A d j (37),V - N (24), V - A d v (22), V - C onj (20), N - P rep - N (13), V - P rep - V (6). S i c omp aramos los d os rd enes , nos p erc atamos d e q ue s on b as tante s imilares , ex c ep to alg unos as p ec tos p artic ulares (p or ejemp lo, el P ron- V ). P or lo tanto, c onc luimos q ue la d iferenc ia d e c antid ad d e h oras d e es tud io d e es p aol entre los d os niveles d e es tud iantes (entre los c uales h ay una d iferenc ia d e 128 h oras en el ap rend iz aje d e la leng ua es p aola) no afec ta muc h o teniend o en c uenta los res ultad os d e los us os , p or p arte d e los d os niveles , d e las p alab ras c omb inatorias tanto en lo referente a las c oloc ac iones c omo en lo q ue s e refiere a las c olig ac iones . A d em s , s eg n la jerarq ua d e d ific ultad o d e errores (D et- N , N - V , A d j- N , V - A d j, N - A d j, V - A d v/V - N , V - C onj, V - P rep - V /N - P rep - N ), p rop onemos el s ig uiente rd en d e ap rend iz aje q ue ira d es d e una etap a m s temp rana a una m s tard a (al rev s d e la d e errores ): V - P rep V /N - P rep - N , V - C onj, V - A d v/V - N , N - A d j, V - A d j, A d j- N , N - V , D et- N .

R evis ta d e L ing s tic a y L eng uas A p lic ad as . IS S N : 1886- 2438

|25

A c ontinuac i n, ob s ervaremos la relac i n q ue s e es tab lec e entre las c ateg oras d e las p alab ras c omb inatorias y los tip os d e errores . S eg n los res ultad os , nos d imos c uenta d e q ue p ara los es tud iantes d el nivel I, los tip os d e errores c on may or frec uenc ia varan entre el tip o l x ic o (5 d e las 11 c omb inac iones lis tad as anteriormente), el g ramatic al (3 c omb inac iones ) y el ortog r fic o (2 c omb inac iones ). C on res p ec to a las c omb inac iones d el tip o l x ic o, los errores tiend en a s er d e la c las e voc ab ulario . P or otra p arte, en c uanto al nivel II, ob s ervamos q ue la may ora d e los tip os d e errores d e may or frec uenc ia p ertenec en al tip o l x ic o (10 d e 11 c omb inac iones ), ex c ep tuand o una c omb inac i n d e tip o g ramatic al. A d em s , d entro d e las c omb inac iones d el tip o l x ic o, los errores m s frec uentes s on d e la c las e s entid o . S i c otejamos las d iferenc ias entre los d os niveles , la d ic c i n es el tip o d e las p alab ras c omb inatorias en el q ue c ometen errores c on m s frec uenc ia amb os niveles . C onc entr nd onos en el tip o l x ic o, notamos la d iferenc ia entre los d os niveles : los es tud iantes d el nivel I tiend en a c ometer errores d e la c las e voc ab ulario mientras q ue los d el nivel II, p or los d e la c las e s entid o . E n res umen, en las etap as d e ap rend iz aje, ex is te un ord en d e fac ilid ad a d ific ultad q ue va d es d e el tip o ortorg r fic o h as ta el g ramatic al y el l x ic o. A d em s , en c uanto al tip o l x ic o, la d ific ultad d el s entid o s em ntic o ap arec e en una etap a m s tard a q ue el voc ab ulario.

5 . CONCL US IN
T omand o c omo b as e el C orp us d e A p rend ic es T aiw anes es d e E s p aol- C ontras te entre Inc orrec c i n y C orrec c i n, c read o y anotad o c on etiq uetas d e errores y P O S p or L u (20052006), y s irvi nd onos d e los ins trumentos analtic os es p ec fic os d e c orp us , h emos p retend id o es tud iar el d es arrollo l x ic o d e los es tud iantes q ue ap rend en el es p aol c omo s eg und a leng ua ex tranjera. N os h emos c entrad o en el c otejo d e las p alab ras c omb inatorias emp lead as en d is tintos niveles d e ap rend iz aje y p rop ues to un c ontinum en lo q ue s e refiere al g rad o d e fac ilid ad d el p roc es o d e ap rend iz aje, q ue s era el s ig uiente: V - P rep - V /N - P rep - N , V - C onj, V - A d v/V - N , N - A d j, V - A d j, A d j- N , N - V , D et- N . A d em s , no s lo nos p erc atamos d e q ue en las etap as d e ap rend iz aje, ex is te un ord en d e fac ilid ad a d ific ultad q ue va d es d e el tip o otorg r fic o h as ta el g ramatic al y el l x ic o; s ino q ue tamb i n es p ec ific amos q ue la d ific ultad d el s entid o s em ntic o ap arec e en una etap a m s tard a q ue el voc ab ulario c on res p ec to al tip o l x ic o d e las p alab ras c omb inatorias . F inalmente, q ueremos ex p res ar nues tro d es eo d e q ue los res ultad os d el p res ente trab ajo fac iliten tanto la c omp rens i n d el p roc es o d e ad q uis ic i n d el es p aol c omo s eg und a leng ua c omo el d is eo d id c tic o d erivad o d e s ta.

RE F E RE NCIA S B IB L IOG R F ICA S


A ijmer, K ., & A . B . S tens trom (2004). Discourse Patterns in Spoken and Written Corpora. A ms terd am: J . B enjamins .

26 |

R evis ta d e L ing s tic a y L eng uas A p lic ad as

volumen 3 ao 2008

A l- B toos h , M .A . (2005). Interlang uag e L ex ic olog y of A rab S tud ents of E ng lis h : A C omp uter L earner C orp us - B as ed A p p roac h . Dissertation Abstracts International, A: The H umanities and Social Sciences, 66- 1: 161- A - 162- A . A lex op oulou, A . (2005). A n A p p roac h to th e T reatment of E rrors in S p anis h as a F oreig n L ang uag e C las s es from th e P ers p ec tive of E rror A naly s is . E studios de Linguistica Aplicada, 23: 101- 125. C h uang , Y . (1996). Corpus Analysis of the Vocabulary in the J unior and Senior H igh School Students' E nglish Textbooks and Writings in Taiwan. T aip ei: C rane. C ob b , T . (2003). A naly z ing L ate Interlang uag e w ith L earner C orp ora: Q ueb ec R ep lic ations of T h ree E urop ean S tud ies . The Canadian Modern Language R eview, 59: 393- 423. F low erd ew , J . (2006). U s e of S ig nalling N ouns in a L earner C orp us . International J ournal of Corpus Linguistics, 11- 3: 209- 226. G onz alez - E s p res ati, C . (2002). E rror A naly s is and Interlang uag e of B raz ilian L earners of S p anis h and S p anis h L earners of P ortug ues e. H ermeneu, 4: 237- 239. G rang er, S . (1998). Learner E nglish on Computer. L ond on, N ew Y ork : L ong man. H uang , L .Y . (2000). C orp ora and S ec ond L ang uag e T eac h ing and L earning . P ap er p res ented at th e Q ianX iNian Linguistics Conference, N ational C h eng C h i U nivers ity . K its nk i, M . (2006). L ang uag e C orp ora and F oreig n L ang uag e T eac h ing . E esti R akenduslingvistika U hingu Aastaraamat, 2: 93- 107. L iang , M . (2006). P O S T ag g ing R eliab ility on E F L L earners ' W ritten D ata . F oreign Language Teaching and R esearch, 38: 279- 286. L is i, C .D . (2001). E ng lis h L 2 Interlang uag e W riting D evelop ment: S ome S imilarities and D ifferenc es among S p anis h L 1 A d oles c ent L earners . Dissertation Abstracts International, A: The H umanities and Social Sciences, 62- 4: 429- A . M nnink , I.D .; C . M air, & M . H und t (2000). P ars ing a L earner C orp us ? . In Corpus Linguistics and Linguistic Theory. A ms terd am: R od op i: 81- 90. N eff, J .; F . B alles teros ; E . D afouz ; F . M artnez ; J . P . R ic a & M . D ez (2004). F ormulating W riter S tanc e: A C ontras tive S tud y of E F L L earner C orp ora . In Applied Corpus Linguistics: A Multidimensional Perspective. A ms terd am: R od op i: 73- 89. N eff, J .; E . D afouz ; H . H errera; F . M artnez & J . P . R ic a (2003). C ontras ting L earner C orp ora: T h e U s e of M od al and R ep orting V erb s in th e E x p res s ion of W riter S tanc e. In G rang er, S , & P etc h - T y s on, S . ed s . E xtending the Scope of Corpus-based R esearch: New Applications, New Challenges: 211- 230. A ms terd am: E d itions R od op i B .V . S c ott, M . (1996). O x ford W ord S mith T ools . V ers ion 4. O x ford : O x ford U nivers ity P res s . T s eng , Y . C . & H .C . L iou (2006). T h e E ffec ts of O nline C onjunc tion M aterials on C olleg e E F L S tud ents ' W riting . System, 34: 270- 283. W ang , S .P . (1999). Integ ration of C orp us - B as ed A p p roac h into an E A P C las s . Second PanAsia Conference-An Int. F orum. S eoul, K orea. h ttp ://140.116.245.232/jap an_ c orp us h ttp ://c h s s .montc lair.ed u/ling uis tic s /M E L D / h ttp ://leo.meik ai.ac .jp /~ tono/lc orp us lis t.h tml h ttp ://mail.tk u.ed u.tw /d w ib le/ind ex .h tm h ttp ://nora.h d .uib .no/c orp ora/1997- 1/0262.h tml h ttp ://w w w .uib .no/mailman/p ub lic /c orp ora- arc h ive/2006- J une/002850.h tml

R evis ta d e L ing s tic a y L eng uas A p lic ad as . IS S N : 1886- 2438

|27

You might also like