maestria_docs/05 TENDENCIAS ACTUALES DE LA INFORMACION NORLAN/BIBLIOGRAFÍA. MAESTRÍA EN BIOMATEMÁTICA/MIC.BIBLIOGRAFÍA COMPLEMENTARIA/Libros de Metodología de la Investigación/AUTORES CUBANOS/Textos de Invest-Bacallao/CENAP17.doc

{\rtf1\ansi\ansicpg1252\uc1 \deff2\deflang1033\deflangfe3082{\fonttbl{\f0\froman\fcharset0\fprq2{\*\panose 02020603050405020304}Times New Roman;}{\f2\fmodern\fcharset0\fprq1{\*\panose 02070309020205020404}Courier New;}{\f23\froman\fcharset238\fprq2 Times New Roman CE;}{\f24\froman\fcharset204\fprq2 Times New Roman Cyr;}{\f26\froman\fcharset161\fprq2 Times New Roman Greek;}{\f27\froman\fcharset162\fprq2 Times New Roman Tur;}{\f28\froman\fcharset186\fprq2 Times New Roman Baltic;}{\f35\fmodern\fcharset238\fprq1 Courier New CE;}{\f36\fmodern\fcharset204\fprq1 Courier New Cyr;}{\f38\fmodern\fcharset161\fprq1 Courier New Greek;}{\f39\fmodern\fcharset162\fprq1 Courier New Tur;}{\f40\fmodern\fcharset186\fprq1 Courier New Baltic;}}{\colortbl;\red0\green0\blue0;\red0\green0\blue255;\red0\green255\blue255;\red0\green255\blue0;\red255\green0\blue255;\red255\green0\blue0;\red255\green255\blue0;\red255\green255\blue255;\red0\green0\blue128;\red0\green128\blue128;\red0\green128\blue0;\red128\green0\blue128;\red128\green0\blue0;\red128\green128\blue0;\red128\green128\blue128;\red192\green192\blue192;}{\stylesheet{\nowidctlpar\adjustright \f2\lang3082 \snext0 Normal;}{\*\cs10 \additive Default Paragraph Font;}{\s15\nowidctlpar\adjustright \f2\lang3082 \sbasedon0 \snext15 Texto de nota al final;}{\*\cs16 \additive \super \sbasedon10 endnote reference;}{\s17\nowidctlpar\adjustright \f2\lang3082 \sbasedon0 \snext17 Texto de nota al pie;}{\*\cs18 \additive \super \sbasedon10 footnote reference;}{\*\cs19 \additive \sbasedon10 Document 8;}{\*\cs20 \additive \b\i\fs24 \sbasedon10 Document 4;}{\*\cs21 \additive \sbasedon10 Document 6;}{\*\cs22 \additive \sbasedon10 Document 5;}{\*\cs23 \additive \f2\fs24\lang1033 \sbasedon10 Document 2;}{\*\cs24 \additive \sbasedon10 Document 7;}{\*\cs25 \additive \sbasedon10 Bibliogrphy;}{\*\cs26 \additive \sbasedon10 Right Par 1;}{\*\cs27 \additive \sbasedon10 Right Par 2;}{\*\cs28 \additive \f2\fs24\lang1033 \sbasedon10 Document 3;}{\*\cs29 \additive \sbasedon10 Right Par 3;}{\*\cs30 \additive \sbasedon10 Right Par 4;}{\*\cs31 \additive \sbasedon10 Right Par 5;}{\*\cs32 \additive \sbasedon10 Right Par 6;}{\*\cs33 \additive \sbasedon10 Right Par 7;}{\*\cs34 \additive \sbasedon10 Right Par 8;}{\s35\keep\keepn\nowidctlpar\tx-720\hyphpar0\adjustright \f2 \snext35 Document 1;}{\*\cs36 \additive \sbasedon10 Doc Init;}{\*\cs37 \additive \f2\fs24\lang1033 \sbasedon10 Tech Init;}{\*\cs38 \additive \sbasedon10 Technical 5;}{\*\cs39 \additive \sbasedon10 Technical 6;}{\*\cs40 \additive \f2\fs24\lang1033 \sbasedon10 Technical 2;}{\*\cs41 \additive \f2\fs24\lang1033 \sbasedon10 Technical 3;}{\*\cs42 \additive \sbasedon10 Technical 4;}{\*\cs43 \additive \f2\fs24\lang1033 \sbasedon10 Technical 1;}{\*\cs44 \additive \sbasedon10 Technical 7;}{\*\cs45 \additive \sbasedon10 Technical 8;}{\*\cs46 \additive \b\i\fs24 \sbasedon10 Documento 4;}{\*\cs47 \additive \sbasedon10 Bibliogr.;}{\*\cs48 \additive \sbasedon10 Documento 5;}{\*\cs49 \additive \f2\fs24\lang1033 \sbasedon10 Documento 2;}{\*\cs50 \additive \sbasedon10 Documento 6;}{\*\cs51 \additive \sbasedon10 Documento 7;}{\*\cs52 \additive \sbasedon10 Documento 8;}{\*\cs53 \additive \f2\fs24\lang1033 \sbasedon10 Documento 3;}{\*\cs54 \additive \sbasedon10 P<>r. der. 1;}{\*\cs55 \additive \sbasedon10 P<>r. der. 2;}{\*\cs56 \additive \sbasedon10 P<>r. der. 3;}{\*\cs57 \additive \sbasedon10 P<>r. der. 4;}{\s58\keep\keepn\nowidctlpar\tx-720\hyphpar0\adjustright \f2 \snext58 Documento 1;}{\*\cs59 \additive \sbasedon10 P<>r. der. 5;}{\*\cs60 \additive \sbasedon10 P<>r. der. 6;}{\*\cs61 \additive \sbasedon10 P<>r. der. 7;}{\*\cs62 \additive \sbasedon10 P<>r. der. 8;}{\*\cs63 \additive \f2\fs24\lang1033 \sbasedon10 T<>cnico 2;}{\*\cs64 \additive \f2\fs24\lang1033 \sbasedon10 T<>cnico 3;}{\*\cs65 \additive \sbasedon10 T<>cnico 4;}{\*\cs66 \additive \f2\fs24\lang1033 \sbasedon10 T<>cnico 1;}{\*\cs67 \additive \sbasedon10 Inic. doc.;}{\*\cs68 \additive \sbasedon10 T<>cnico 5;}{\*\cs69 \additive \sbasedon10 T<>cnico 6;}{\*\cs70 \additive \sbasedon10 T<>cnico 7;}{\*\cs71 \additive \sbasedon10 T<>cnico 8;}{\*\cs72 \additive \f2\fs24\lang1033 \sbasedon10 Inic. est. t;}{\s73\qj\nowidctlpar\tx-720\adjustright \f2\expndtw-3\lang1034 \snext73 lcs;}{\*\cs74 \additive \f2\fs24\lang1033 \sbasedon10 NAME;}{\s75\fi-720\li720\ri720\sb480\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext75 Tdc 1;}{\s76\fi-720\li1440\ri720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext76 Tdc 2;}{\s77\fi-720\li2160\ri720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext77 Tdc 3;}{\s78\fi-720\li2880\ri720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext78 Tdc 4;}{\s79\fi-720\li3600\ri720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext79 Tdc 5;}{\s80\fi-720\li720\nowidctlpar\tqr\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext80 Tdc 6;}{\s81\fi-720\li720\nowidctlpar\hyphpar0\adjustright \f2 \sbasedon0 \snext81 Tdc 7;}{\s82\fi-720\li720\nowidctlpar\tqr\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext82 Tdc 8;}{\s83\fi-720\li720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext83 Tdc 9;}{\s84\fi-1440\li1440\ri720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext0 \sautoupd index 1;}{\s85\fi-720\li1440\ri720\nowidctlpar\tqr\tldot\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext0 \sautoupd index 2;}{\s86\nowidctlpar\tqr\tx9360\hyphpar0\adjustright \f2 \sbasedon0 \snext86 Encabezado de tda;}{\s87\nowidctlpar\adjustright \f2\lang3082 \sbasedon0 \snext87 Title;}{\*\cs88 \additive _Equation Caption;}}{\info{\title EL SIGNIFICADO DE LAS CORRELACIONES PARCIAL Y MULTIPLE}{\author VRIPRI}{\operator VRIPRI}{\creatim\yr2001\mo5\dy24\hr11\min15}{\revtim\yr2001\mo5\dy24\hr11\min15}{\version2}{\edmins0}{\nofpages8}{\nofwords3307}{\nofchars18851}{\*\company ISP Pinar del Rio}{\nofcharsws23150}{\vern73}}\paperw12188\paperh15590\margl1440\margr1440 \widowctrl\ftnbj\aenddoc\pgnstart81\hyphhotz945\aftnnar\notabind\wraptrsp\nocolbal\sprslnsp\lytprtmet\hyphcaps0\viewkind1\viewscale100 \fet0{\*\ftnsep \pard\plain \nowidctlpar\adjustright \f2\lang3082 {\chftnsep
\par }}{\*\aftnsep \pard\plain \sl-20\slmult0\nowidctlpar\widctlpar\adjustright \f2\lang3082 {
\par }}{\*\aftnsepc \pard\plain \nowidctlpar\adjustright \f2\lang3082 {
\par }}{\*\aftncn \pard\plain \nowidctlpar\adjustright \f2\lang3082 {
\par }}\sectd \pgnrestart\pgnstarts81\linex0\headery1440\footery1440\colsx709\titlepg\sectdefaultcl {\header \pard\plain \qc\nowidctlpar\hyphpar0\adjustright \f2\lang3082 {\lang1024\cgrid {\shp{\*\shpinst\shpleft1440\shptop0\shpright10748\shpbottom240\shpfhdr1\shpbxpage\shpbypara\shpwr3\shpwrk0\shpfblwtxt0\shpz0\shplid2049{\sp{\sn shapeType}{\sv 1}}{\sp{\sn fFlipH}{\sv 0}}{\sp{\sn fFlipV}{\sv 0}}{\sp{\sn lTxid}{\sv 65536}}{\sp{\sn dxTextLeft}{\sv 0}}{\sp{\sn dyTextTop}{\sv 0}}{\sp{\sn dxTextRight}{\sv 0}}{\sp{\sn dyTextBottom}{\sv 0}}{\sp{\sn fFilled}{\sv 0}}{\sp{\sn lineWidth}{\sv 0}}{\sp{\sn fLine}{\sv 0}}{\sp{\sn fShadow}{\sv 0}}{\shptxt \pard\plain \nowidctlpar\tqc\tx4654\tqr\tx9308\adjustright \f2\lang3082 {\tab \tab }{\expnd0\expndtw-3\lang1033 P<>g No. }{\field{\*\fldinst ref {\expnd0\expndtw-3\lang1033 p<>gina \\* ARABIC}}{\fldrslt {\b\expnd0\expndtw-3\lang1033 <20>Error!Marcador no definido.}}}{\expnd0\expndtw-3\lang1033
\par }}}{\shprslt{\*\do\dobxpage\dobypara\dodhgt8192\dptxbx{\dptxbxtext\pard\plain \nowidctlpar\tqc\tx4654\tqr\tx9308\adjustright \f2\lang3082 {\tab \tab }{\expnd0\expndtw-3\lang1033 P<>g No. }{\field{\*\fldinst ref {\expnd0\expndtw-3\lang1033 p<>gina \\* ARABIC}}{\fldrslt {\b\expnd0\expndtw-3\lang1033 <20>Error!Marcador no definido.}}}{\expnd0\expndtw-3\lang1033
\par }}\dpx1440\dpy0\dpxsize9308\dpysize240\dpfillfgcr255\dpfillfgcg255\dpfillfgcb255\dpfillbgcr255\dpfillbgcg255\dpfillbgcb255\dpfillpat0\dplinehollow}}}}{
\par }\pard \qc\sa140\sl-100\slmult0\nowidctlpar\hyphpar0\adjustright {\fs10
\par }}{\*\pnseclvl1\pnucrm\pnstart1 {\pntxta .}}{\*\pnseclvl2\pnucltr\pnstart1 {\pntxta .}}{\*\pnseclvl3\pndec\pnstart1 {\pntxta .}}{\*\pnseclvl4\pnlcltr\pnstart1 {\pntxta .}}{\*\pnseclvl5\pndec\pnstart1 {\pntxtb (}{\pntxta )}}{\*\pnseclvl6\pnlcltr\pnstart1 {\pntxtb (}{\pntxta )}}{\*\pnseclvl7\pnlcrm\pnstart1 {\pntxta )}}{\*\pnseclvl8\pnlcltr\pnstart1 {\pntxta )}}{\*\pnseclvl9\pnlcrm\pnstart1\pnindent720\pnhang{\pntxtb (}{\pntxta )}}\pard\plain \qc\nowidctlpar\hyphpar0\adjustright \f2\lang3082 {\b\lang1033 EL SIGNIFICADO DE LAS CORRELACIONES PARCIAL Y MULTIPLE}{\field{\*\fldinst {\lang1033 PRIVATE }{\fs20\lang1033 {\*\datafield \bin16 phoenix}}}{\fldrslt }}{\lang1033
\par }\pard \qj\nowidctlpar\hyphpar0\adjustright {\expnd0\expndtw-3\lang1033
\par \tab La correlaci<63>n entre dos variables suele enmascarar el efecto de una tercera variable o de un grupo de otras variables que tienen una relaci<63>n causal sobre las dos primeras. Por ejemplo, muchos atributos como el peso, la talla, la fuerza f<>sica, el vocabulario, el conocimiento general y las habilidades de lectura tienden a incrementarse regularmente entre los 6 y los 18 a<>os.
\par
\par \tab A lo largo de este amplio rango de edad, la correlaci<63>n entre dos cualesquiera de aquellos atributos ser<65> positiva y casi seguramente alta, debido al factor de madurez representado por la edad, que exhibe una alta correlaci<63>n con ambos. De hecho, la correlaci<63>n puede hacerse muy peque<75>a si se elimina la variabilidad debida a las diferencias de edad. Esta variabilidad puede eliminarse de dos modos: (a) experimentalmente, mediante un criterio de selecci<63>n que tome en cuenta s<>lo a ni<6E>os o adolescentes de la misma edad; (b) anal<61>ticamente, removiendo el efecto de la edad mediante el c<>lculo de la }{\b\expnd0\expndtw-3\lang1033 correlaci<63>n parcial.}{\expnd0\expndtw-3\lang1033
\par
\par \tab Seleccionar ni<6E>os de la misma edad puede ser costoso, en t<>rminos de muestreo o reducir dr<64>sticamente los tama<6D>os muestrales. El control anal<61>tico a trav<61>s de la correlaci<63>n parcial es m<>s eficiente, porque hace uso de toda la informaci<63>n disponible.
\par
\par \tab La notaci<63>n r}{\expnd0\expndtw-3\lang1033\sub xy.z}{\expnd0\expndtw-3\lang1033  se utiliza para designar la correlaci<63>n entre las variables x e y, despu<70>s de remover el efecto de la variable z, lo que equivale a decir, "manteniendo a z constante". Igualmente, la notaci<63>n r}{\expnd0\expndtw-3\lang1033\sub xy.uvwz}{\expnd0\expndtw-3\lang1033  designa la correlaci<63>n entre x e y, luego de remover o eliminar el efecto conjunto de u, v, w y z sobre la asociaci<63>n entre x e y.
\par
\par \tab En estudios de predicci<63>n, en que hay una variable dependiente o a predecir, y un grupo de variables independientes o predictores, se hace necesario estudiar la asociaci<63>n entre la primera y las segundas. La medida de la asociaci<63>n entre una variable dependiente y un grupo de predictores es el coeficiente de correlaci<63>n m<>ltiple R, que se reduce al coeficiente de correlaci<63>n de Pearson en el caso en que hay un solo predictor. El coeficiente de correlaci<63>n m<>ltiple R}{\expnd0\expndtw-3\lang1033\sub x(yzuv)}{\expnd0\expndtw-3\lang1033  se interpreta como la correlaci<63>n simple entre los valores observados de la variable x, y los valores estimados de dicha variable a partir del grupo de predictores y, z, u y v.
\par
\par \tab Para calcular, estimar o predecir los valores de la variable dependiente, se emplea com<6F>nmente la llamada regresi<73>n m<>ltiple.
\par \tab
\par \tab En la pr<70>ctica, la regresi<73>n m<>ltiple se usa con dos fines: (a) con fines predictivos (para estimar la variable dependiente como funci<63>n de dos o m<>s predictores) y (b) con fines explicativos (para identificar los predictores que son realmente relevantes con fines de predicci<63>n). El uso de la regresi<73>n con fines predictivos no presenta mayores dificultades t<>cnicas (debido por supuesto, a la gran cantidad de softwares estad<61>sticos que existen para tal fin); sin embargo, el uso de la regresi<73>n con fines explicativos es considerablemente  problem<65>tico debido al fen<65>meno conocido como "repetibilidad diferencial", que es causante de que el diagn<67>stico a que se arriba con respecto a la relevancia de un predictor cualquiera, dependa de la identidad y de la cantidad de los otros predictores incluidos en la ecuaci<63>n de regresi<73>n.
\par
\par \tab Para eludir los aspectos t<>cnicos relativos al fundamento de estos procedimientos, e ilustrar los conceptos mencionados, reproduciremos a continuaci<63>n varios resultados a los que adjuntaremos los correspondientes comentarios explicativos.
\par
\par \tab Los resultados que siguen se obtuvieron al intentar predecir el rendimiento acad<61>mico de estudiantes que ingresaron en el primer a<>o de la carrera de medicina, a partir de un grupo de variables o indicadores que caracterizan a cada estudiante al momento de su ingreso. La variable dependiente fue el promedio general obtenido al culminar el primer a<>o (PG1); los predictores, el <20>ndice acad<61>mico de la ense<73>anza preuniversitaria (IA), una prueba de razonamiento verbal (RV), el puntaje en una entrevista con cada candidato (ENT), y los resultados en los ex<65>menes de ingreso en las asignaturas de matem<65>tica (MAT), qu<71>mica (QUI) y biolog<6F>a (BIOL). El an<61>lisis se llev<65> a cabo con el software estad<61>stico SYSTATW5 para Windows.
\par
\par }{\fs14\expnd0\expndtw-1\lang1033
\par  DEP VAR:  PG1    N:   90  MULTIPLE R: 0.451   R}{\fs14\expnd0\expndtw-1\lang1033\super 2}{\fs14\expnd0\expndtw-1\lang1033 : 0.204
\par  STANDARD ERROR OF ESTIMATE:        0.306
\par
\par  VARIABLE      COEFFICIENT    STD ERROR     STD COEF TOLERANCE    T    P(2 TAIL)
\par
\par  CONSTANT          \_17.504        5.800        0.000      .      \_3.018    0.003
\par  IA                  0.198        0.059        0.344     0.921    3.368    0.001
\par  RV                 \_0.001        0.004       \_0.037     0.893   \_0.358    0.721
\par  ENT                 0.051        0.170        0.031     0.895    0.300    0.765
\par  MAT                 0.005        0.005        0.114     0.885    1.095    0.277
\par  QUI                 0.012        0.008        0.158     0.936    1.559    0.123
\par  BIO                 0.006        0.003        0.204     0.978    2.058    0.043
\par
\par
\par                         ANALYSIS OF VARIANCE
\par
\par  SOURCE       SUM\_OF\_SQUARES   DF  MEAN\_SQUARE     F\_RATIO       P
\par
\par  REGRESSION           1.982     6        0.330       3.538       0.004
\par  RESIDUAL             7.752    83        0.093
\par
\par }{\expnd0\expndtw-3\lang1033 \page \tab Los resultados anteriores describen una salida cl<63>sica de un an<61>lisis de regresi<73>n m<>ltiple. PG1 es la variable dependiente,N = 90, el n<>mero de estudiantes (el n<>mero de casos en que se bas<61> el ajuste del modelo), R es el coeficiente de correlaci<63>n m<>ltiple ya referido y R}{\expnd0\expndtw-3\lang1033\super 2}{\expnd0\expndtw-3\lang1033 , cuando se expresa en t<>rminos porcentuales representa el porcentaje de variaci<63>n en la variable dependiente (PG1) que `explican' los predictores (IA, RV, ENT, MAT, QUI y BIO). A menudo se ha atribuido a R}{\expnd0\expndtw-3\lang1033\super 2}{\expnd0\expndtw-3\lang1033  mucha mayor importancia que la que tiene en realidad.
\par
\par \tab El error est<73>ndar de la estimaci<63>n (EEE), es la desviaci<63>n est<73>ndar de la variable estimada y da una idea de la precisi<73>n en su estimaci<63>n. Cuando la regresi<73>n se usa con fines predictivos, el EEE es el criterio m<>s <20>til para decidir entre dos ecuaciones: es preferible aquella que tenga el menor EEE, porque proporciona las estimaciones m<>s precisas. Los valores \_17.504, 0.198, \_0.001, 0.051, 0.005, 0.012 y 0.006 son las estimaciones de los par<61>metros de la ecuaci<63>n de regresi<73>n m<>ltiple, que definen el modelo de la manera siguiente:
\par }{\fs20\expnd0\expndtw-2\lang1033
\par PG1= 0.198*IA-0.001*RV+0.051*ENT+0.005*MAT+0.012*QUI+0.006*BIO-17.504
\par }{\expnd0\expndtw-3\lang1033
\par \tab Por ejemplo, para un estudiante con un <20>ndice acad<61>mico de 99.25, una prueba de razonamiento verbal de 3, un valor de 2 en la entrevista, y un resultado de 84 en la prueba de ingreso de matem<65>tica, 98 en la de qu<71>mica y 95 en biolog<6F>a, su promedio esperado en el curso ser<65>a:
\par
\par PG1}{\expnd0\expndtw-3\lang1033\sub e}{\expnd0\expndtw-3\lang1033  = 0.198*99.25-0.001*3+0.051*2+0.005*84+0.012*98+0.006*95-17.504 = 4.41}{\cs18\expnd0\expndtw-3\lang1033\super \chftn {\footnote \pard\plain \s17\qj\sa240\nowidctlpar\tx-720\hyphpar0\adjustright \f2\lang3082 {\cs18\expnd0\expndtw-3\lang1033 \~\~\~\~}{\cs18\expnd0\expndtw-3\lang1033\super \chftn }{\expnd0\expndtw-3\lang1033  El resultado observado para este caso real fue de 4.71, es decir, el pron<6F>stico puntual qued<65> 0.3 unidades por debajo del verdadero resultado. Normalmente, los resultados no se estiman puntualmente, sino a trav<61>s de un intervalo de estimaci<63>n al que se asocian cierta precisi<73>n y cierta confiabilidad.}}}{\expnd0\expndtw-3\lang1033
\par
\par \tab Con la excepci<63>n de la constante (-17.504), los coeficientes o par<61>metros del modelo de regresi<73>n m<>ltiple tienen la siguiente interpretaci<63>n: cada coeficiente representa el cambio (incremento o disminuci<63>n) que experimenta la variable dependiente, cuando el predictor al cual corresponde el coeficiente en cuesti<74>n cambia en una unidad, mientras el resto se mantiene constante. As<41> pues, si el <20>ndice acad<61>mico se incrementa en una unidad, en tanto que el resto de los predictores no cambia, habr<62>a que esperar un aumento de 0.198 en el promedio general (PG1).
\par
\par \tab Es f<>cil ver, de este modo, que el coeficiente que acompa<70>a a un predictor en la ecuaci<63>n de regresi<73>n m<>ltiple, proporciona una medida del impacto de dicho predictor sobre la variable a predecir. No obstante, por dos razones fundamentales, esta medida de impacto debe interpretarse con cautela: en primer lugar, porque depende de las unidades en que se mide el predictor, y en segundo lugar, y m<>s importante, porque depende de la identidad y del n<>mero de los predictores que se encuentran en el modelo. En efecto, si en la ecuaci<63>n de regresi<73>n figuran predictores muy asociados entre s<>, tiene poco sentido hablar de un cambio en uno de ellos que no se acompa<70>e del correspondiente cambio en los otros, y este hecho de por s<>, se alza como un obst<73>culo a la interpretaci<63>n que hicimos de los coeficientes de la regresi<73>n.
\par
\par \tab La siguiente columna (STD ERROR) contiene los errores est<73>ndar de los estimadores de los par<61>metros. Los par<61>metros son desconocidos, y al ajustar la ecuaci<63>n de regresi<73>n, lo que hacemos es obtener sus valores estimados. Ahora bien, dichas estimaciones est<73>n sujetas a error, y la magnitud de ese error es precisamente el error est<73>ndar. La columna que aparece encabezada con el t<>tulo STD COEFF contiene los coeficientes estandarizados. Estos coeficientes estandarizados proporcionan tambi<62>n una medida del impacto del predictor en cuesti<74>n, con la ventaja de que, a diferencia de los coeficientes no estandarizados, no dependen de las unidades de medida de la variable. Como puede observarse en las `salidas' anteriores, la variable de mayor impacto es el <20>ndice acad<61>mico (STD COEFF= .344), seguida de la prueba de biolog<6F>a (STD COEFF = .204) y de la prueba de qu<71>mica (STD COEFF= 0.158). No obstante, tampoco los coeficientes estandarizados se libran del efecto de la asociaci<63>n entre los predictores, por lo que, en <20>ltima instancia, tambi<62>n dependen de cu<63>les predictores figuran en la ecuaci<63>n y en qu<71> cantidad. Los coeficientes estandarizados tienen tambi<62>n otra interpretaci<63>n intesante: ellos representan la correlaci<63>n parcial entre el predictor en cuesti<74>n y la variable a predecir, despu<70>s de haber removido el efecto del resto de los predictores. Por ejemplo, 0.158 es la correlaci<63>n parcial entre PG1 y QUI, luego de eliminar el efecto de IA, RV, ENT, MAT y BIO.
\par
\par \tab Las "tolerancias" dan una idea del grado de asociaci<63>n existente entre el conjunto de predictores. La tolerancia que acompa<70>a a cada variable se interpreta como 1 menos el cuadrado del coeficiente de correlaci<63>n m<>ltiple (R}{\expnd0\expndtw-3\lang1033\super 2}{\expnd0\expndtw-3\lang1033 ) entre dicha variable y el resto de los predictores. La tolerancia puede variar entre 0 y 1. Cuando una tolerancia es peque<75>a, ello indica que gran parte de la informaci<63>n que contiene la variable en cuesti<74>n, se encuentra contenida en el resto de los predictores, en otros t<>rminos, que entre la variable en cuesti<74>n y alguno o algunos de los otros predictores existe redundancia.
\par
\par \tab Cuando la regresi<73>n se utiliza con fines predictivos, o sea, con el prop<6F>sito de predecir mejor, no tiene mayor importancia incluir predictores redundantes si con ello se consigue mejorar la calidad de la predicci<63>n.}{\cs18\expnd0\expndtw-3\lang1033\super \chftn {\footnote \pard\plain \s17\qj\sa240\nowidctlpar\tx-720\hyphpar0\adjustright \f2\lang3082 {\cs18\expnd0\expndtw-3\lang1033 \~\~\~\~}{\cs18\expnd0\expndtw-3\lang1033\super \chftn }{\expnd0\expndtw-3\lang1033  Aun con fines predictivos, no es deseable que exista mucha redundancia en los predictores, porque ello incrementa innecesariamente el n<>mero de variables en el modelo. Desde el punto de vista pr<70>ctico, el modelo es m<>s <20>til cuanto menos predictores tenga, siempre que ello no afecte la capacidad predictiva.}}}{\expnd0\expndtw-3\lang1033  Sin embargo, si la regresi<73>n se pretende usar con fines explicativos, es necesario tratar de conseguir el mayor grado posible de independencia (el menor grado posible de redundancia) entre los predictores. Es f<>cil ver, que en este caso, todas las tolerancias son relativamente altas, lo cual es expresi<73>n de un alto grado de independencia entre las variables.
\par
\par
\par \tab Los valores de T y su p asociada, suelen emplearse con el fin de identificar los predictores realmente relevantes. El principio subyacente es que el valor de T corresponde en la realidad a una prueba de significaci<63>n sobre los coeficientes de la regresi<73>n, y m<>s concretamente, a una prueba de significaci<63>n contra la hip<69>tesis nula de que el coeficiente en cuesti<74>n es 0. Cuando el valor de T es grande, es decir, cuando se acompa<70>a de un valor de p peque<75>o (convencionalmente, menor que 0.05) se considera que se ha puede rechazar la hip<69>tesis nula de que el coeficiente es cero, y se concluye, por tanto, que la variable es relevante. Sin embargo, <20>ste es uno de los aspectos m<>s criticables dentro del empleo de la regresi<73>n con fines explicativos. De hecho, como se ha anticipado, este diagn<67>stico est<73> fuertemente influido por el principio de repetividad diferencial al que ya se aludi<64>. Cuando un grupo de variables muy asociadas aparecen juntas en la ecuaci<63>n de regresi<73>n, su efecto, que puede ser individualmente muy grande sobre la variable dependiente, tiende a repartirse creando la falsa impresi<73>n de que ninguna de ellas es relevante, o puede ser absorbido por alguna de las variables a expensas de las dem<65>s.
\par
\par \tab Si analizamos los resultados del ejemplo anterior de un modo inercial, concluir<69>amos que s<>lo el IA y BIO son predictores relevantes. Nos aproximar<61>amos mucho m<>s a la realidad, si afirm<72>semos que dentro de una bater<65>a de predictores compuesta por IA, RV, ENT, MAT, QUI y BIO, el aporte relevante, }{\b\expnd0\expndtw-3\lang1033 para un nivel de significaci<63>n dado}{\expnd0\expndtw-3\lang1033  lo hacen s<>lo el primero y el <20>ltimo de estos predictores. Como puede el lector f<>cilmente comprender, una afirmaci<63>n de este tipo es de escaso valor con fines explicativos, porque adolece de un valor completamente relativo y contingente, que no toma en cuenta, por ejemplo, eventuales predictores, que por ignorancia o negligencia no han sido incluidos en el modelo, y que podr<64>an hacer variar completamente el diagn<67>stico de relevancia, al punto extremo de revertirlo radicalmente. Estos son algunos de los escollos que suelen encontrarse cuando se pretende aplicar la regresi<73>n con fines explicativos. M<>s adelante se incluyen algunos ejemplos ilustrativos.
\par
\par \tab Por <20>ltimo, el valor de F, al que normalmente en la pr<70>ctica suele asign<67>rsele una importancia mayor de la que merece, indica, cuando se acompa<70>a de un valor de p peque<75>o (convencionalmente, menor que 0.05) que no todos los predictores son irrelevantes, o en otros t<>rminos, que el porcentaje de variaci<63>n explicado por la regresi<73>n es significativamente superior a cero. Esto, en realidad, es bastante poco para los fines pr<70>cticos con que usualmente se emplea la regresi<73>n. No obstante, si un valor de F no es significativo, no es necesario hacer otras indagaciones posteriores en relaci<63>n con el modelo en cuesti<74>n.
\par
\par \tab Consideremos las siguientes `salidas' a partir del mismo grupo de datos: 90 estudiantes en los que se registraron las variables ya descritas. Si la ecuaci<63>n de regresi<73>n se ajustase s<>lo con IA y BIO, la capacidad predictiva se mantiene pr<70>cticamente inalterada (EEE = 0.306 con todos los predictores y EEE = 0.305 con s<>lo IA y BIO). Con fines predictivos es indiferente utilizar a todos los predictores a s<>lo a IA y BIO. Sin embargo, la variable BIO, que en el modelo con todos los predictores resultaba significativa, ahora que s<>lo se acompa<70>a de IA, pierde su significaci<63>n estad<61>stica para el nivel de significaci<63>n convencional de 0.05.
\par
\par }{\fs14\expnd0\expndtw-1\lang1033
\par  DEP VAR:   PG1      N:  90  MULTIPLE R: 0.413  R}{\fs14\expnd0\expndtw-1\lang1033\super 2}{\fs14\expnd0\expndtw-1\lang1033 : 0.170
\par  STANDARD ERROR OF ESTIMATE:        0.305
\par
\par  VARIABLE      COEFFICIENT    STD ERROR     STD COEF TOLERANCE    T   P(2 TAIL)
\par
\par  CONSTANT          \_16.565        5.592        0.000      .      \_2.962    0.004
\par  IA                  0.206        0.056        0.357     0.994    3.647    0.000
\par  BIO                 0.006        0.003        0.181     0.994    1.850    0.068
\par
\par
\par                         ANALYSIS OF VARIANCE
\par
\par  SOURCE       SUM\_OF\_SQUARES   DF  MEAN\_SQUARE     F\_RATIO       P
\par
\par  REGRESSION           1.657     2        0.829       8.925       0.000
\par  RESIDUAL             8.077    87        0.093
\par
\par }{\expnd0\expndtw-3\lang1033
\par \tab Si ajust<73>semos la ecuaci<63>n de regresi<73>n ahora con IA y con las asignaturas que componen el examen de ingreso, resulta que la capacidad predictiva mejora notablemente (EEE = .279), pero que la variable m<>s relevante (de hecho la <20>nica, de acuerdo al umbral convencional del 0.05) es BIO.
\par }{\fs14\expnd0\expndtw-1\lang1033
\par
\par  DEP VAR:   PG1      N:  90  MULTIPLE R: 0.415  R}{\fs14\expnd0\expndtw-1\lang1033\super 2}{\fs14\expnd0\expndtw-1\lang1033 : 0.172
\par  STANDARD ERROR OF ESTIMATE:        0.279
\par
\par  VARIABLE      COEFFICIENT    STD ERROR     STD COEF TOLERANCE    T   P(2 TAIL)
\par
\par  CONSTANT           \_8.590        5.746        0.000      .      \_1.495    0.139
\par  IA                  0.108        0.058        0.191     0.948    1.867    0.065
\par  MAT                 0.007        0.004        0.179     0.954    1.752    0.083
\par  QUI                 0.011        0.007        0.169     0.984    1.675    0.098
\par  BIO                 0.007        0.003        0.264     0.978    2.617    0.011
\par
\par                              ANALYSIS OF VARIANCE
\par
\par  SOURCE       SUM\_OF\_SQUARES   DF  MEAN\_SQUARE     F\_RATIO       P
\par
\par  REGRESSION           1.339     4        0.335       4.307       0.003
\par  RESIDUAL             6.450    83        0.078
\par }{\expnd0\expndtw-3\lang1033
\par \tab En los tres casos considerados el porcentaje de variaci<63>n explicado es significativamente superior a cero, tal como se infiere de los valores de F y sus valores de p asociados para los tres modelos.
\par
\par
\par LA COMPARACION ENTRE DOS GRUPOS CON RESPECTO A UN CARACTER CONTINUO
\par
\par \tab Este texto no pretende considerar en sus aspectos t<>cnicos el problema de la comparaci<63>n entre dos grupos con respecto a un car<61>cter continuo. Estos problemas han sido extensamente tratados por la literatura y virtualmente en cualquier texto de estad<61>stica puede encontrar el lector informaci<63>n al respecto.
\par
\par \tab En estas p<>ginas nos limitaremos a presentar y discutir algunos resultados.
\par }{\fs20\expnd0\expndtw-2\lang1033
\par }\pard \qj\fi-720\li720\nowidctlpar\tx-720\tx0\hyphpar0\adjustright {\fs20\expnd0\expndtw-2\lang1033 -\tab Resultados de pruebas de comparaci<63>n de medias entre dos grupos
\par }\pard \qj\nowidctlpar\tx-720\hyphpar0\adjustright {\fs20\expnd0\expndtw-2\lang1033
\par                            Two Sample T\_Test Results
\par
\par Response: IA
\par Group:               CRI1 = 1                     CRI1 = 0
\par Count \_ Mean         183           99.15557       22             98.765
\par 95% C.L. of Mean     99.0556       99.25554       98.40378       99.12622
\par Std.Dev \_ Std.Error  .6854401      5.066919E\_02   .8148079       .1737176
\par
\par                     \_\_\_\_\_ Equal Variances \_\_\_\_\_  \_\_\_\_\_ Unequal Variances \_\_\_\_\_
\par T Value \_ Prob.      2.472887      0.0134         2.158375       0.0407
\par Degrees of Freedom                 203                           25.05542
\par Diff. \_ Std. Error   .3905716      .1579415       .3905716       .1809563
\par 95% C.L. of Diff.    8.101192E\_02  .7001313       1.795363E\_02   .7631896
\par
\par F\_ratio testing group variances    1.413095      Prob. Level     0.1166
\par }{\expnd0\expndtw-3\lang1033
\par \tab CRI1 = 1 designa el grupo de los estudiantes que terminaron con <20>xito acad<61>mico (n=183) y CRI1 = 0, los que terminaron con fracaso (n=22). El <20>ndice acad<61>mico promedio en uno y otro grupo fue, respectivamente 99.16 y 98.77 (aproximando a dos cifras decimales), con intervalos de confianza respectivos de 99.06 a 99.26 y de 98.40 a 99.13.
\par
\par \tab Cuando se comparan dos grupos existen dos opciones: considerar que las varianzas de ambos son iguales, o que son desiguales. La regla pr<70>ctica que com<6F>nmente se aplica consiste en valerse del valor de F y su significaci<63>n asociada, que aparecen al final del ejemplo. Si esta F es no significativa, como en el caso del ejemplo en que p=0.1166>0.05, se trabaja con la opci<63>n de varianzas iguales.
\par
\par \tab Nuevamente se presentan dos opciones: (a) la opci<63>n cl<63>sica de la prueba de significaci<63>n o (b) el c<>lculo de un intervalo de confianza para la diferencia de las medias. Ambas opciones pueden encontrarse en los resultados del ejemplo. Si se opta por la alternativa (a) diremos que el valor de t=2.47 al que se asocia una p=0.0134 (<0.05) es significativo y que por tanto ambos grupos difieren respecto del <20>ndice acad<61>mico; si se opta por la alternativa (b) diremos que la diferencia en el valor del <20>ndice acad<61>mico entre ambos grupos var<61>a entre 8.101192E\_02 (aproximadamente 0.0081 expresado en notaci<63>n cient<6E>fica) y .7001 con una confiabilidad asociada del 95%.
\par
\par
\par LA COMPARACION ENTRE VARIOS GRUPOS CON RESPECTO A UN CARACTER CONTINUO
\par
\par \tab Cuando en lugar de dos se desean comparar varios grupos con respecto a un atributo continuo, la t<>cnica de elecci<63>n es el an<61>lisis de la varianza. En este sentido, el an<61>lisis de la varianza puede interpretarse como una extensi<73>n de la prueba de comparaci<63>n de medias. Los grupos involucrados en el an<61>lisis de la varianza pueden surgir de un solo criterio de clasificaci<63>n con varios niveles (an<61>lisis de la varianza de una v<>a), o de dos m<>s criterios de clasificaci<63>n (an<61>lisis de la varianza de dos o m<>s v<>as). Cuando hay un solo criterio de clasificaci<63>n, el an<61>lisis de la varianza (ANOVA) de una v<>a permite responder a la interrogante de si hay o no diferencias entre los niveles de dicho criterio clasificatorio. Cuando hay m<>s criterios de clasificaci<63>n, el ANOVA permite responder a las interrogantes de los efectos correspondientes a cada uno de los factores. Tambi<62>n permite dar una respuesta estad<61>stica a la existencia o no de interacci<63>n.
\par
\par \tab  Se dice que hay interacci<63>n entre dos factores o criterios de clasificaci<63>n, cuando las diferencias entre los niveles de un factor no dependen del nivel particular del otro factor en que nos encontremos. Supongamos que se proponen dos m<>todos (A y B) para la ense<73>anza de una lengua extranjera, y que dichos m<>todos de aplican por igual a ni<6E>os y adultos (N y D) y que se miden los resultados en una prueba de rendimiento. En este caso tenemos dos criterios de clasificaci<63>n, cada uno de ellos con dos niveles: uno es el m<>todo, el otro es la condici<63>n de ser ni<6E>o o adulto. Si no hubiese interacci<63>n entre m<>todo y edad, la relaci<63>n entre el m<>todo A y el B ser<65>a la misma, tanto para ni<6E>os como para adultos. Por el contrario, si hay interacci<63>n la relaci<63>n entre el m<>todo A y el B ser<65>a diferente para ni<6E>os y para adultos. No tendr<64>a sentido entonces preguntar cu<63>l de los m<>todos es preferible, porque ello depender<65>a de la condici<63>n del estudiante.
\par
\par \tab Al igual que en el apartado que en el apartado anterior, se incluye y se discute un ejemplo. Se han considerado en <20>l dos criterios clasificatorios: EVA1 con dos niveles y CLASIF, con cuatro niveles. Se ha supuesto que la interacci<63>n es nula. La `salida' es la siguiente.
\par
\par   EVA1
\par          1.000        2.000
\par  CLASIF
\par          1.000        2.000        3.000        4.000
\par
\par }{\fs20\expnd0\expndtw-2\lang1033
\par DEP VAR:  TPP      N:  61
\par
\par                         ANALYSIS OF VARIANCE
\par
\par  SOURCE       SUM\_OF\_SQUARES   DF  MEAN\_SQUARE     F\_RATIO       P
\par
\par  EVA1                33.767    1       33.767       0.308       0.581
\par  CLASIF            2157.937    3      719.312       6.552       0.001
\par
\par  ERROR             6148.253   56      109.790
\par }{\expnd0\expndtw-3\lang1033
\par \tab La interpretaci<63>n, que se origina en los valores de F y sus p asociadas, es la siguiente: no existe efecto significativo debido al criterio EVA1 y s<> existe efecto significativo debido al factor CLASIF.
\par
\par \tab Si se decidiese incluir la interacci<63>n en el modelo, los resultados ser<65>an los siguientes:
\par
\par }{\fs20\expnd0\expndtw-2\lang1033  DEP VAR:  TPP     N:   61
\par
\par
\par                         ANALYSIS OF VARIANCE
\par
\par  SOURCE       SUM\_OF\_SQUARES   DF  MEAN\_SQUARE     F\_RATIO       P
\par
\par  EVA1*CLASIF        250.951    3       83.650       0.752       0.526
\par  CLASIF             372.468    3      124.156       1.116       0.351
\par  EVA1                13.627    1       13.627       0.122       0.728
\par
\par  ERROR             5897.302   53      111.270
\par }{\expnd0\expndtw-3\lang1033
\par \tab Ninguno de los t<>rminos del modelo resulta significativo: ni el efecto de EVA1, ni el de CLASIF ni el de la interacci<63>n entre ambos (EVA1*CLASIF). Aunque pueda parecer sorprendente, la inclusi<73>n de la interacci<63>n -aunque no resulte significativa- ha absorbido parte del efecto de CLASIF, que ahora se torna no significativo.
\par
\par }}