Download as pdf
Download as pdf
You are on page 1of 10
COMO SELECCIONAR LA VARIANTE OPTIMA DE AGRUPAMIENTO Y CLASIFICACION DE LOS DATOS RICARDO ALBERTO VALLS ALVAREZ + Expedicién Geolégica "Habana - Matanzas” - Especialista en Geoquimica y modelaje Geomatematico _—_———_— Revista Universidad Eafit - No. 85 53 See RESUMEN El tratamiento previo de los datos antes de su elaboracién y procesamiento, es un paso primordial para poder garantizar resultados confiables e interpretaciones exitosas. Al conjunto de estos tra- bajos pertenece el proceso de clasificacién (agrupa- miento o estratificacién) de los datos, elcual -sino es correcto- puede malograr la investigacién desde su inicio. En el presente articulo se explica un sencillo, Pero muy seguro modelo geomatematico para seleccionar entre varias variantes de estratificacion de los datos la éptima para obtener los mejores resultados del procesamiento de los mismos. También se abordan algunas implicaciones genéticas de este andlisis. El método V.0.C. (variante optima de clasificacién), dado su sencillez, efectividad e importancia, debe aplicarse previ mente a cualquier procesamiento estadistico de la poblacién. 1. INTRODUCCION Con las tareas de clasificacién previa de los datos, el gedlogo tropieza constantemente y si no realizaunacorrectaestratificacién de sus datos (ono realiza clasificacién alguna en general), llegar a resultados alejados de la realidad. Por ejemplo, un geoquimico que process los resultados del bario de un muestreo metalométrico en un sector sin haber diferenciado las muestras al menos por tipos litolégicos, obtuvo el “prometedor” cuadro de anomalias que se muestra en la Fig. 1 y planificé, en base a estas, trabajos mas detallados (y mas costosos) de verificacién. En realidad, tal como se aprecia en la Fig. 2, lo que dicho geoquimico obtuvo fue un mapa de anomalias “titofficas”. O sea que mapes los principales grupos litolégicos presentes en el sector de los trabajos que se diferencian por sus clarks (granitoides- 0.083%: tobas andesiticas-0,065 %; calizas- 0.08% y serpentinitas- 0,0001%, segtin datos de Voitkievich et al. (1970). También tenemos que recurri a la olasiticacién de los datos cuando enfrentamos la tarea de establecer lla especializacién geoquimica de los grupos petro- \égicos del area de estudios, Laclasificacién "por tipo petro o litol6gico" es la mas usualmente empleada, aunque puede presentar algunas desventajas, tales como: . - Mala documentacién del punto, - No representatividad estadistica de alguna clase, cuando la cantidad de datos correspon- dientes ala misma es inferior a 20 - 30 unidades. - Laexistencia de grupos petrolégicos con carac- teristicas similares, lo cual dificulta enorme- mente su clasificacién. ‘Aigunos de estos problemas son casi imposibles de solucionar y pertenecen al asi llamado 5% de inse- guridad estadistica de los trabajos. No obstante, el presente modelo geomatematico le seré de gran ayuda, sobre todo en lo correspondiente a la titima dificultad enumerada, permitiéndole seleccionar la mejor variante de estratificacién, con lo cual se garantiza una alta calidad y objelividad de las futuras investigaciones. 2. MODELOV.0.C. A continuacién se detallan los pasos que componen el modeloV.0.C. (variante éptima de clasificacén) para la correcta estratificacién de sus datos. 21 Selecclon de los elementos mas informativos Esta tarea puede ser solucionada de dos formas diferentes. bien, confeccionando varios perfiles geoquimicos para establecer visualmente 1 comportamiento de los distintos elementos o parametros analizados (Valls, 1989) y de esa forma seleccionar los que mejor varien su comportamiento en correspondencia con los cambios geolégicos del corte (Fig. 3); 0 bien determinando mediante las ecuaciones 1, 2 y 3, el coeficiente de variacién de cada elemento, seleccionando como "mas informa- tivos” aquellos con variaciones que oscilen entre el 50 y el 150% (Valls, 1987). No es recomendable incluir en estos calculos aquellos elementos donde mas del 50% de sus valores sean nulos 0 trazas. x (2) $ $.100/ X (3) Vv ————— Revista Universidad Eafit -No. 85 55 —————— Donde, X. Es el valor del pardmetro analizado en cada "muestra. X Es lamedia aritmética. n__ Es lacantidad total de muestras analizadas. Es la desviacién tipica o varianza V___ Es el coeficiente de variacién del parametro analizado, Como puede apreciarse en la Fig. 3, la Plata a diferencia del Bario, mantiene un comportamiento completamente independiente a las variaciones geolégicas del corte, raz6n por la cual no se toma la Plata en calidad de elemento informativo. Este andlisis se hace bien para el elemento mas importante -en el caso de tratarse del estudio de un yacimientoo manifestacién mineral- o bien de un Conjunto de elementos representativos. En este segundo caso, debemos llegar a obtener un pardmetro unico representativo del conjunto de elementos seleccionados como los mas informativos. En este caso propongo emplear el Coeficiente Correlacional (Valls, 1989) pues es mas sencillo que otfos modelos geomatematicos como el de Componente Principal, por sélo citar uno de ellos. (%- x) “> =) (rt) SxS) Donde, . Para determinar el Coeficiente Correlacional (C.C.), se efectéa con los elementos seleccionados un analisis correlacional binario. Aquellos elementos que presenten correlaciones positivas y sensibles se ubicaran multiplicados en el numerador del Coeficiente Correlacional. Cuando fa correlacién sea inversa y sensible con alguno de los elementos ubicados en el numerador, dicho elemento se ubicaré en el denominador det C.C. Al terminar de distribuir todos los elementos en el C.C., verifique que no exista ninguna contradiccién en el mismo, como es el caso de un elemento que pueda ubicarse tanto en el numerador como en el denominador, producto de sus correlaciones Positivas 0 negativas con diferentes elementos del C.C. En esos casos, ambos elementos se excluyen del C.C. Para ejemplificarlo anterior, enel Anexo Ise muestra un caso real, con toda la secuencia de opera- ciones a efectuar. En dicho ejemplo fueron seleccio- nados gréficamente tres elementos como los mas informativos. La correlaci6n en cada caso se deter- mina (Kazhdan et al., 1979) mediante la ecuacién (4), comprobandose su sensibiidad por medio del criterio de Student segin la ecuacién (5). Si los célculos se realizan “a mano”, la ecuacién (6) puede ser mds facil de utilizar para determinar la correlacién. ”) Vn-2 [tp,n-2] 56 Revista Universidad Eafit - No. 85 ' Es la correlaci6n. t Es el valor critico de la correlacion ic t Es el valor del criterio de Student para Pn-2 =0,05% yn-2g1 22 Estratificacién de la informacion La “estratificacién” o clasificacién y agrupa- miento de los datos iniciales, es un proceso largo y ‘a menudo tedioso, pero sin el cual no se pueden garantizar resultados correctos del proceso investi- gativo. Es por ello preterible dedicarle al mismo todo el tiempo que sea necesario. La estratificacién exige un gran profesionalismo al investigador quien deberd esooger entre varias ‘opciones de clasificacién, desde las mas generales a las mas detalladas. En el ejemplo representado en la Fig. 2, se podrian proponer las siguientes variantes: A. Serpentinitas, granitoides, tobas y calizas. B. Serpentinitas masivas, otras _serpentinitas, Qranitoides, rocas vuleandgeno-sedimentarias. C. Complejo ofiolitico, tobas y calizas. ‘varias otras mds, en dependencia a los intereses y objetivos del investigador. 2.3. Tratamiento de los valores "huracanados” La determinaci6n de la existencia de valores huracanados se realiza independientemente en cada variante de estratificacién adoptada. Este Paso es muy importante pues la presencia de tan s6lo uno de estos valores, puede llevar a resultados equivocos con posterioridad. Existen muiliples formas para determinar la existen- cia de valores huracanados (Bondarienko et al. 1985), pero para las necesidades de este modelo puede satistacernos el uso de la ecuacién (7). 7) Xhur> X+5S Donde, Xhur Son los valores huracanados X Es la media de los valores en la variante analizada (Vid. ecuacién 1) . SEs la varianza de los valores en la variante analizada (Vid. ecuacién 2). Una vez determinado el valor limite *X hur’, compro- bamos si existen en Ia variante valores iguales 0 superiores al mismo. Si asi fuera, elimine dicho dato de la variante. Sila cantidad de datos en la misma es menor de 30, entonces en vez de eliminar el dato, sustituyalo por el valor de media (X) antes determinada. Las variantes asi preparadas ya estan listas para ser investigadas en busca de la variante optima de clasificacién. 2.4 Verificacién de la calidad de la estratificacion Come critetio estadistico para seleccionar la variante éptima, se tomé el que plantea que una estratificacién correcta, la dispersién interna de cada grupo, clase o variante ha de ser la minima, en tanto que la dispersi6n entre grupos ha de ser la maxima (Yamane, 1980). Expresdndolo en un lenguaje “menos matematico”, pudiera decirse que cada clase ha de ser lo mas homogénea posible internamente y lo més diferente posible en comparacién con las demds. En otras palabras, se escogerd como variante éptima aquella que presente la mayor diferencia entre sus varianzas internas y externas. Para efectuar estos cAlculos, se empleardn las ecuaciones (8), (9) y (10). (8) Ww, 2 (9) S w= (10) Sb Donde, N Eslacantidad total de datos Ny Es eltotal de datos en el estrato analizado Sess Revista Universidad Eafit - No. 85 87 W, _ Es la ponderacién del estrato S?n__Es la varianza del estrato analizado ‘S?w_ Es la varianza interna total X Es la media total de los datos. X Es la media del estrato analizado y S$? b_Es la varianza extema total. En la tabla 1 se muestran los resultados reales de la aplicaciénde! modelo V.0.C. enunaminaauritera en serpentinitas. Como elemento informative se tomé el oro no sélo por ser el principal elemento de la mineralizacién, sino también por ser el tinico elemento determinado cuantitativamente mediante andlisis dosiméstico, lo cual garantiza una mejor calidad de la informacién Teniendo en cuenta las labores de muestreo reali- zadas (Leal et al., 1982), fundamenté tres variantes de estratificacién: ‘A. Portipos petro-estructurales, sin teneren cuenta el nivel de donde fue tomada la muestra (cinco estratos). B. Por niveles, sin tener en cuenta el tipo petro- estructural (cinco estratos). C. Ypor tipos petro-estructurales, teniendo en cuen- ta el nivel de donde se toms la muestra (21 estratos). Tabla 1. Verificaci6n de la calidad de la estratif- cacién de los datos en una mena aurifera en serpen- tinitas. VARIANTES 9 2. DIFERENCIA Sw Sb A 7.921,21 2.91272 1.59151 B 2.10092 3.909.591. 808,67 © 5,057,975. 766,97 707.00 Los resultados presentados en la tabla 1, permiten seleccionar como la variante éptima de clasificacion ala estratificacién por niveles, sin tener en cuenta el tipo petro-estructural, por lo cual el resto del andlisis lo etectué con los datos agrupados en esa forma. Lo anterior me permitié ademas suponer (dado el comportamiento indendiente del oro con respecto los tipos petro-estructurales muestreados) que la génesis de la mineralizacién aurifera era eminente- mente hidrotermalmetasomatica ya que afectaba casi por igual a todas las rocas del area y s6lo existian variaciones en la medida que nos alejaba- mos del foco hidrotermal (de ahi la influencia de los riveles de profundidad muestreados). Esta suposicién fue colaborada posteriormente, gracias al modelaje geomatematico detallado que efectué en dicha zona mineral. 3. CONCLUSIONES Y RECOMENDACIONES En los trabajos de investigacién geolégica, Principalmente aquellos que trabajan con grandes volimenes de datos (geoquimica, geotisica, hidrogeologia, etc.), la estratificacién o agrupamien- to de los datos mejora la calidad de los resultados y permite lograr interpretaciones mas seguras y objetivas. Es por ello que debe realizarse siempre este proceso y dedicarle al mismo todo el tiempo ‘que le sea menester. En|os casos en que disponga de més de un elemen- to 0 pardmetro informativo, recurra al célculo del Coeficiente Correlacional (C.C.) en base al analisis de correlacional binario de dichos elementos informativos, tal como se explica en detalle en el Anexo I En ciertos casos, la aplicacién del modelo V.0.C. a una estratificacién bien planeada permite llegar a conclusiones importantes, incluso acerca de la génesis de un yacimiento. Es por ello que le recomiendo no proceder de forma mecénica ni a la seleccién de las variantes, ni_a la aplicacién de este modelo. Recuerde -en todo caso- que el modelo, por muy eficiente y sencillo que sea, es s6lo una herramienta y depende de la maestria del que lo utiliza. ANEXO |. SECUENCIA DE OPERACIONES PARA DETERMINAR EL COEFICIENTE CORRELACIONAL (C.C.) EN UN SECTOR DE ESTUDIOS NOTA 1.- Teniendo en cuenta que el objetivo de este anexo es explicar cémo realizar los cdlculos y no el resultado en si, es que presentamos las tablas reducidas. De esta forma ahorramos también un ovo de espacio, 58 Revista Universidad Eafit - No. 85 SF NOTA 2 - Dado que el Bario presenta en el caso analizado una distribucién log-normal, el analisis del mismo se efectué a partir del logaritmo de sus datos. iniciales. CORRELACION Log Ba: Pb NN log Ba (log Ba)? Pb Pb? Jog Bax Pb 1 20 40 03 0,09 06 2 23 529 06 0,38 1,38 3 26 6,76 1,0 1,0 26 | 60 2.48 6,15 04 0,16 0,992 Total 147,36 (367,32 75,6 211,32 206,06 Sustituyendo en (6) ‘Sustituyendo en (5) 1 206,06 - + (147,36) (75,6) : 6 tic) = 28 = VOR 4 | 4 | vi 0,81 367,32 a (147,36) || 211,36 ay (75.6) y' r = 20,39 / 25,04 r= 0,81 Conclusion 1 - Dado que t (c) >t (p, n-2), se acepta que existe una correlacién positiva y sensible entre ambos elementos. Por lo tanto el C.C. toma la siguiente forma parcial C.C. = Log Bax Pb t(c) 10,62 En tanto que t (95,58) = ,00 NOTA 3 - De no disponer a mano de una tabla de Student (vid Anexo I!) para determinar el valor de t(p.n-2), y siempre que n> 30, usted puede asumir que Para Para 95,0% t=2 399.9% t=3 CORRELACION Log Ba: Cu NN log Ba (log Bay? cu cu? log Bax Cu 7 20 40 70 700 20 2 23 529 8 64 18.4 3 26 6,76 4 16 10,4 60 2,48 6,15 2 4 9,92 Total 147,36 367,32 306 2.2436 699,2 Revista Universidad Eafit- No. 85 59 Sustituyendo en (6) Sustituyendo en (5) 1 99,2 - + \2 ~ Gy (147,38) (306) t(c) 367,32 ~ 147,26) [22 6-4 (c06)"] : ap (147,96) |l2eag6 - + t(c) " © r= ~ 52,34 / 60,75 r =~ 0,86+ab" 4 En tanto que t (95,58) = 2,00 Conclusién 2 - Dato que t (c)>t9p,n-20, se acepta. NOTA 4. - Queda ahora demostrar que entre el que existe una correlacién positiva y sensible entre Pby el Cu también existe una correlaci6n negativa ambos elementos. Por lo tanto el C.C. toma la __y sensilbe. En caso contrario, ambos elementos siguiente forma parcial: quedarian excluidos del C.C., quedando como C.C. - (Log Bax Pb)/Cu tinico elemento informativo el Log Ba.! CORRELACION Pb: Cu NN Pb Pb? cu Cu? Pbx Cu 1 0,3 0,09 10,0 100,0 3,0 2 0,6 0,36 8,0 64,0 48 3 1,0 1,0 40 16,0 40 60 0,4 0,16 20 40 08. Total 75,6 211,32 3060 © 2243.6 150,3 ‘Sustituyendo en (6) Sustituyendo en (5) 1 150,3 ~ (75,6) (306) . re 60 t(c) 0,84 211,32 - o (75,6 \[e 243,6 - a (206)"| V ~(-0,84)" ~ 235,26 / 281,55 t(e) = 14,79 0-2 0,84 . En tanto que t (95,58) = 2,00 60 Revista Universidad Eafit - No. 85 Conclusi6n3.- Dado quet(c)> t(p,n-2),seacepta ANEXO Il. EXTRACTO DE LA TABLA DE que existe una correlacién negativa y sensible entre DISTRIBUCION DE STUDENT, TOMADA DE ambos elementos. Por lo tanto el C.C. toma definiti-. | KAZHADAN, A.B. et al. (1979) vamente la siguiente forma: N P 95 99 99,9 C.C. (Log Ba x Pb) /Cu « 0.05 8.010.001 5 257 403 «686 Para las determinaciones aplicando el modelo V.0.C. se emplearan los resultados de dicho C.C. ad 228 a7 488 20 2,09 285 3.85 Nota 5 - Todos estos calculos se pueden hacer en 30 2,04 275 3,65 muy poco tiempo empleando algun sistema de programas estadisticos. Personalmente recomien- 40 2,02 2,70 3.55, do el MICROSTAT, por la potencia y variedad de 60 2,00 2,66 3,46 sus célculos y el efectivo sistema para el manejo de datos que posee. 120 1,98 2,58 3,37 00 1,96 2,58 3,29 vous oo: swoune * oe FIG. 1 MAPA DE LOS NIVELES DE ANOMALIAS DEL BARIO EN UN SECTOR DE ESTUDIOS Revista Universidad Eafit - No. 85 6 FIG. 3 SELECCION "GRAFICA” DE LOS ELEMENTOS INFORMATIVOS EN EL CORTE A-B. 62 Revista Universidad Eafit - No. 85 BIBLIOGRAFIA BONDARENKO, V.N. ot al. Métodos estadisticos durante las bisquedas geoquimicas de los yacimientos minerales. Santiago de Cuba: 1985, pp. 103 - 108. KAZHDAN, Alexei Borisievich ot al. El modelaje matematico en la geologia y la exploracién de yacimiantos minerales (en rusol. Mosci; Nedra, 1979, pp. 50-51. LEAL OROPESA, Regino ot al. Informe sobre la bUsqueda orientativa de polimetilicos y oro San Marin (inédito). C.N.F.G., 1982, passim. VALLS ALVAREZ, Ricardo Alberto. Los métodos ‘geoquimicos en la busqueda de talco on ol macizo me- tamérfico del Escambray. Revista Tecnoligica, Vol. XIX, No. 1, pp. 9-16, Enero - Marzo, 1989. Modelaje geomatemético de la manifestacién Cuprifera"La Arena’. Serie Geolégica, No. 1, pp. 104 “118, 1987. VOITKIEVICH, Georgi Vitoldovich. Pequefo prontuatio geoquimico (enruso). Moscé: Nedra, 1970, pp. 50-51. YAMANE, Taro. Elementary Sampling Theory. La Habana: Pueblo y Educacién, 1980, pp. 103 - 108. Revista Universidad Eafit- No. 85 63

You might also like