Página inicial...
 
MÉTODOS ESTADÍSTICOS BÁSICOS EN EL LABORATORIO
@ Ramón Fernández Ruiz, 2001.Contacta conmigo ...


Muestreo de poblaciones gausianas (parámetros de laboratorio). Estimadores fieles y consistentesError en una medida e intervalos de confianzaDeterminación de los parámetros de máxima verosimilitud.

Propagación de errores en las medidas de laboratorioEjemplos de aplicación de la ley de la propagación de los errores: área, concentración, pH, distancia interplanar dhkl .

Regresión Lineal Simple y Método de los Mínimos Cuadrados. Errores de las estimaciones. Correlación lineal.

Probabilidad P(x).

Cuando nosotros realizamos un experimento, realmente estamos siguiendo un procedimiento previamente descrito como consecuencia del cual obtenemos una cantidad o cantidades que constituyen la medida de una determinada magnitud. El espacio de muestras lo forma el conjunto de resultados obtenidos u obtenibles en un experimento. Por ejemplo en la media de un área rectangular, nosotros medimos dos parámetros la base b y la altura h, de modo que el espacio de muestras asociado a la medida del área de un rectángulo será el conjunto de valores reales positivos de la base y de la altura, esto es, . La figura 1 muestra el espacio de muestras asociado a la medida de un área.

Figura 1. Espacio de muestras en la medida de un área.

Un suceso A es un conjunto de resultados posibles que constituye un subespacio del espacio de muestras. Por ejemplo si nosotros medimos el área de un rectángulo de base b = 2 cm con un error de  y una altura h = 3 cm con un error , el suceso asociado será el conjunto de valores tales que b este comprendido entre 1.9 y 2.1 cm y h entre 2.8 y 3.2 cm. La figura 2 muestra la representación de un suceso área de valor A = 6 cm2 en el espacio de muestras asociado.


Figura 2. Suceso en el espacio de muestras de un área.

Si en la determinación de un suceso A realizamos N  experimentos de los cuales n dan el suceso A, la probabilidad de que dicho suceso ocurra será

.      (1)

Démonos cuenta de que la definición formal de la probabilidad está definida para un número infinito de experimentos. En el laboratorio el número de experimentos siempre es finito por lo que el valor que podemos obtener para la probabilidad de que un suceso A suceda, siempre será una estimación de su valor real . Si realizamos un número razonable de experimentos, el valor de la estimación de la probabilidad tiende a aproximarse a su valor verdadero.
Una práctica muy instructiva sobre este tema es la siguiente. Sabemos que un dado tiene seis caras, cada una con un valor del 1 al 6. En principio, si el dado es perfecto, la probabilidad de que salga el valor 1, 2, 3 o cualquiera de ellos es . Si eso es verdad vamos a estimar el valor de la probabilidad de que nos salga por ejemplo el valor 5, es decir vamos ha diseñar un proceso para estimar , que sabemos debe de ser . Nuestro experimento serán lanzar el dado, de modo que el número de experimentos N será el número de lanzamientos que realicemos. Cuando nos salga un valor 5, lo anotaremos y veremos cuantas veces ocurre en los N experimentos realizados. Una vez realizados los N experimentos, estimaremos el valor de la probabilidad de que salga un 5 mediante la fórmula

  .    (2)
Si el número de experimentos es pequeño (1 < N < 30), vemos que el valor que obtenemos para no se parece en nada al real . Si seguimos realizando experimentos hasta valores elevados de N (100 < N < 500), vemos como el valor de la probabilidad estimada tiende al valor real . Yo recomendaría que se hiciese la práctica aquí propuesta para comprobar por uno mismo que lo dicho es cierto y para familiarizarse con el concepto de probabilidad.

Función de distribución de probabilidad F(x).

Si las variables o parámetros que estamos evaluando son continuos o lo que es lo mismo hemos realizado un número de experimentos N muy grande, podemos definir la función de distribución F(x) como la probabilidad de que la variable aleatoria  adquiera un valor inferior a x,

.       (3)

De la ecuación (1) sabemos que el intervalo de valores que puede adquirir la probabilidad y por tanto la función F(x) varía entre 0 y 1. La figura 3 nos muestra el aspecto de la función F(x).

 

Figura 3. Función de distribución F(x).
 
Algunas de las propiedades que podemos apreciar de la función F(x) son las siguientes:
 
(1)- F(x) es monótona y siempre creciente.
(2)- Para x tendiendo a infinito la probabilidad total o el valor de F(x) tiende a 1,
.    (4)
 
(3)- La probabilidad de que  sea superior o igual a x será
 
.    (5)
(4)- Si hacemos tender x a menos infinito la probabilidad o el valor de F(x) tiende a 0,
 
. (6)
Densidad de probabilidad f(x)

La densidad de probabilidad f(x) expresa la cantidad de probabilidad por unidad de variable y en términos diferenciales la podemos representar como

.    (7)
Podemos apreciar que el concepto de densidad de probabilidad adquiere sentido si la variable aleatoria  es continua. Consideremos que la densidad de probabilidad tiene la forma que muestra la figura 4, una distribución de densidad típicamente gausiana
 

Figura 4. Densidad de probabilidad gausiana.

La probabilidad total que hemos definido por el valor 1, deberá ser de ser el área total encerrada por la función de densidad de probabilidad, es decir, deberá de cumplirse la condición de normalización
 

.       (8)

Conocida la distribución de densidad de probabilidad, podemos deducir muchos parámetros importantes por ejemplo el valor medio en una medida . Como podemos suponer corresponderá al centro de gravedad de la función de densidad de probabilidad, es decir,
.      (9)
Conocida la función de densidad de probabilidad, la función de distribución F(x) se encuentra perfectamente definida, de modo que
.      (10)

Figura 5. El área rayada corresponde a la probabilidad de que x < a.
Si queremos conocer la probabilidad de que una variable se encuentre comprendida entre un rango de valores a y b, solo tendremos que calcular la probabilidad de que la variable x sea menor que b, esto es F(b) y restarle la probabilidad de que la variable x sea menor que a. En lenguaje matemático esto se traduce en
 
.        (11)

Figura 6. El área rayada corresponde a la probabilidad de que a < x < b.
Cuando en el laboratorio se realizan múltiples medidas de un parámetro determinado, digamos  , lo que obtenemos es una serie de valores x que pueden encontrarse muy cerca del valor  pero no tienen por que ser . Si representamos en forma de histograma los resultados de los N experimentos realizados para la determinación del parámetro , es decir representamos en el eje y la frecuencia  o el número de veces que obtenemos un determinado valor x frente al valor medido experimentalmente de x, se genera una imagen de la forma que tiene la función densidad de probabilidad f(x) asociada a la variable  que estamos estudiando. Esta claro que cuanto mayor sea el número de experimentos N que realicemos mejor definida se encontrara dicha función f(x). En el límite en el que N tienda a infinito la envolvente del histograma tenderá a la función de densidad de probabilidad.
 
Si realizásemos sucesivas medidas del grosor de un libro, podríamos obtener un histograma tal y como el que muestra la figura 5 donde hemos representado las sucesivas medidas del grosor del libro y una estimación de la función de densidad de probabilidad asociada a la variable grosor del libro.
 


Figura 7. Histograma de la medida del grosor de un libro.

En azul la envolvente del histograma o función de densidad asociada f(x). La forma de calcular el valor medio  hemos visto que era en el caso continuo mediante la ecuación (9). El paso del continuo al discreto se traduce matemáticamente en el paso de la integral a un sumatorio, de modo que la mejor estimación del valor medio  que podemos hacer será
 

.       (12)

Momentos .
Los momentos en estadística se definen mediante la ecuación general
,                          (13)
 
donde  es el orden del momento evaluado.
 
Momento de orden 0 (),Normalización.
 
Si calculamos a partir de la ecuación (13) el momento de orden 0, obtenemos que
 

pero como vimos en la ecuación (8), , por lo que llegamos a la conclusión de que el momento de orden 0 nos da la condición de normalización de nuestra función de densidad de probabilidad
.     (14)
Momento de orden 1 (), valor medio.
 
Si ahora calculamos a partir de la ecuación (13) el momento de orden 1, obtenemos que
 
.

Esta claro que la integral , que representa el valor medio del valor medio, nos da el valor medio . Si recordamos la definición de valor medio (9) nos damos cuenta de que la primera integral  es, por definición el valor medio . Por lo tanto el primer momento es nulo

.    (15)

Momento de orden 2 (), varianza .
El momento de orden 2 nos habla de la dispersión de valores alrededor del valor medio ,
.         (16)
La varianza  la definimos como el valor del momento . Las unidades de la varianza corresponden al cuadrado de las unidades del valor medio. Por esta razón se utiliza el parámetro desviación estándar o típica como
,     (17)
de modo que las dimensiones de la desviación estándar , coincidan con las del valor medio .
Por definición el error en la medida de una cantidad es la desviación estándar de la variable medida . El significado geométrico del parámetro  coincide aproximadamente con la semi anchura de la distribución de densidad de probabilidad de la medida. De hecho, veremos que para una distribución de densidad gausiana (variables de laboratorio), el área o probabilidad que cubre el  correspondiente es del 68.2 % del total. Por tanto podremos decir con un 68.2 % de certeza que el valor de nuestra medida será

,    (18)

Momento de orden 3 (), sesgo.

El momento de orden 3 nos habla de la simetría de la dispersión de los valores alrededor del valor medio ,

.     (19)

Para ponderar la magnitud de simetría y normalizar de forma adimensional este parámetro, definimos el sesgo  como el cociente entre el tercer momento y la desviación típica al cubo
.     (20)
 
La figura 8 nos muestra el significado del parámetro sesgo respecto a la distribución de densidad de probabilidad que lo genera.

Figura 8. Densidad de probabilidad con distintos sesgos.
Distribución de probabilidad uniforme y la medida digital.
Una medida digital de una variable x, posee una distribución de densidad de probabilidad discretizada que podemos expresar como

 


.        (21)
 


Figura 9. Densidad de probabilidad en una distribución uniforme.

Lo que esta distribución de densidad de probabilidad nos indica es que en una medida digital nuestra medida o se encuentra en el intervalo (a,b) o se encuentra fuera. La longitud del intervalo representa los alrededores del último dígito en cualquier aparato digital. Por ejemplo en una balanza de cuatro cifras decimales de gramo, será el entorno comprendido entre 0.00005 g y –0.00005 g, para una masa media de 0.0000 g. Si aplicamos lo que sabemos hasta el momento, podemos deducir los parámetros más significativos en este tipo de medidas. Veamos en primer lugar el valor de la constante C. De la condición de normalización de la probabilidad (8) sabemos que
,
de donde vemos que
.   (22)
El valor medio  sabemos que viene dado por la expresión (9), es decir,
,
de donde obtenemos que
.   (23)
La varianza  la calculamos a partir del segundo momento, de modo que
,
lo que nos da como resultado
.   (24)
Por definición, el error en la medida digital dado por (17) será
,    (25)
donde L es el intervalo de medida más pequeño que nuestro aparato digital es capaz de ofrecernos.
Por ejemplo cuando medimos un voltaje con un polímetro digital y obtenemos el valor 2 . 2 3 voltios, podemos darnos cuenta de que la última cifra sigue una distribución uniforme por lo que podemos asegurar que el error de nuestra medida será de
.
Distribución de probabilidad binomial y la estadística de contaje.
Esta distribución es de suma importancia en muchos procesos físicos que suceden en el laboratorio, sobre todo en lo que se refiere a equilibrios termodinámicos y muy especialmente a la interpretación de los espectros.
Supongamos que hacemos un experimento y estamos interesados en saber si sucede o no sucede el suceso A. Si sucede lo hará con una probabilidad p, si no sucede la probabilidad será 1-p. Definimos la variable xi de forma que adquiere el valor 1 si sucede y un valor 0 si no sucede. Si realizamos n veces el experimento podemos crear la variable X cuyo significado sea el número de veces que ocurre el suceso A en la forma
.
En estas condiciones podemos afirmar que la variable X sigue una distribución de probabilidad binomial P(x=k) que viene dada por
 
.                (26)
La distribución de probabilidad binomial, cumple la condición de normalización
.
El valor medio de una distribución binomial, será según la ecuación (12)
,
es decir
.                                   (27)
De forma discreta la varianza la podemos definir mediante la expresión
,                            (28)
de modo que para la distribución binomial que es discreta, podemos buscar el valor de la varianza en la forma
,
de donde obtenemos que la varianza en una distribución binomial es
 

.                           (29)

El error en una media de una variable binomial será
.                              (30)
Un espectro multicanal, consiste en una serie de canales discretos que representan en forma de histograma el número de cuentas, fotones, partículas etc... que se reciben a cada energía, como podemos ver en la figura 10.

Figura 10. Espectro de dispersión de energía de rayos X. En el eje y número de cuentas. En el eje x energía.

Si analizamos uno cualquiera de los canales, podemos definir los sucesos xi contar un fotón con probabilidad p y no contarlo con probabilidad 1-p, de modo que realizando n medidas o experimentos podemos construir la variable número de fotones detectados .
 
Por construcción nos damos cuenta de que la variable N número de fotones detectados, sigue una distribución binomial, por lo que el error de contaje en dicho canal será según la ecuación (30)
 

.

 
La medida de la intensidad, numero de cuentas o altura de un pico cualquiera, I tendrá por tanto asociado un error de contaje proporcional a la raíz cuadrada de dicha intensidad.
 
Distribución de probabilidad gausiana .
La importancia manifiesta de esta distribución radica en que la inmensa mayoría de las variables que se miden en el laboratorio siguen una distribución de densidad de probabilidad gausiana. Normalmente a esta distribución se la caracteriza mediante los parámetros valor medio de la distribución  y desviación estándar , diciendo que la variable sigue una distribución normal o gausiana de parámetros . Analíticamente esta distribución tiene la forma
.      (31)
Gráficamente representa la conocida campana de Gauss que vemos en la figura 11.

Figura 11. Densidad de probabilidad gausiana.
Estrictamente la función de densidad gausiana nunca se anula pero se suele considerar nula  a partir de los valores .
La función de distribución F(x) asociada a la densidad de probabilidad gausiana por definición será
,        (32)
Cuyo aspecto podemos apreciar en la figura 12

Figura 12. Distribución de probabilidad gausiana.
Si calculamos la probabilidad de obtener un valor medio  con una error de , sabemos que según la ecuación (11)
 

lo que nos da una probabilidad del 68.2 %. Si calculamos de la misma forma la probabilidad de obtener un valor medio  con una error de  obtenemos un 95.4 % y si lo hacemos para  la probabilidad es casi total con un 99.8 %.
 
Muestreo de poblaciones gausianas (parámetros de laboratorio). Estimadores fieles y consistentes.
El muestreo consiste en la técnica de cómo obtener información de lo que uno está midiendo a través de la medida repetitiva de los parámetros que la caracterizan. Si queremos medir una cantidad cuyo valor real es m0 , podemos definir como variable aleatoria x la medida que hacemos de m0. Si el aparato de medida que estamos utilizando es suficientemente lineal y estable, cabe esperar que el valor medio de las medidas sea m0, esto es   y su error sea el de la medida .

Si repetimos n veces la medida (x1,x2,...,xn) podemos obtener mucha más información. Se dice que el conjunto de valores (x1,x2,...,xn) es una muestra de orden n de m0 o de la población. La población será el conjunto de infinitos valores que tomaría la variable x al repetir infinitas veces el experimento. De este modo una muestra es un subespacio de la población. Por ejemplo imaginemos que queremos saber la edad de los alumnos de una clase. La población serían todas las edades posibles de los alumnos y una muestra la constituiría considerar la edad de unos cuantos escogidos aleatoriamente, por ejemplo 10 alumnos. El resultado tomará un intervalo de valores posibles (e.j. 20-30 años). Estos datos son representativos de la población que puede ser por ejemplo de 200 alumnos.

En un proceso de medida repetitiva las variables medidas deben de ser independientes y además las densidades de probabilidad de las variables deben de ser las mismas. Esto significa que si por ejemplo estamos midiendo en número de bolas rojas que hay en una urna de bolas rojas y azules, la medida será sacar una bola y mirar su color y además devolveremos la bola medida a la urna antes de realizar una nueva medida para que la probabilidad de que saquemos una azul o roja sea la misma.

Un estimador es un estadístico que nos sirve para estimar un determinado parámetro de la población s = s(x1,x2,...,xn).

Un estimador será fiel si el valor medio del estimador s coincide con el valor real de la población . Lo cerca o lejos que se encuentre el valor medio del estimador respecto al valor real vendrá dado por el error de la medida. En primera instancia cuanto mayor sea el orden de la muestra, menor será el error en la medida.

Un estimador será consistente si en el límite en el que el número de medidas tiende a infinito su varianza tiende a cero, es decir,

.                                  (33)
Evaluemos la fidelidad y consistencia del estimador media aritmética . Como todos sabemos este estimador viene dado por la expresión
.                                   (34)
 
Primero evaluaremos su fidelidad, calculando su valor medio
,
podemos decir que este estimador es fiel.
Analicemos ahora la consistencia de este estimador. Para ello calcularemos su varianza a partir de la definición del segundo momento estadístico
 

Los sumandos del primer sumatorio, por definición de segundo momento, representan las varianzas de cada una de las medidas, que sabemos que son constantes ( o error del instrumento). Los sumandos del segundo sumatorio doble representan las covarianzas de las medidas, que hemos supuesto independientes lo que significa que su valor es cero. De esta forma obtenemos que
 

.

Podemos apreciar que en el límite n infinito la varianza del estimador media aritmética tiende a cero por lo que podemos asegurar que este estimador es consistente.
Operando un poco más obtenemos cual es el error de nuestro muestreo de orden n
 
,                              (35)
 
donde n es el número de medidas que hemos realizado y  es el error instrumental de nuestro aparato.
 
El valor de  corresponde a la varianza asociada a nuestro muestreo  o lo que es lo mismo al error instrumental de nuestro equipo de medida. Su estimación en poblaciones gausianas la podemos realizar mediante el estimador RMS que viene definido por la expresión
 
.                (36)
 
En resumen podemos decir que “en poblaciones gausianas o de laboratorio” en muestreos de orden n los estimadores más importantes son los siguientes
 





Error en una medida e intervalos de confianza.

Según lo que hemos visto en el apartado de muestreo en poblaciones gausianas, el resultado más fiel y consistente viene dado por el valor medio ,

.

El error asociado a este valor si el muestreo realizado es de orden n será ,

,

donde  es el error instrumental que podemos estimar mediante la expresión

.
De este modo podemos rescribir el error asociado a nuestro muestreo en la forma

 
.                         (37)
El valor medido vendrá dado por el valor medio más menos el error de muestreo esto es
.                                 (38)
Si tenemos en cuenta el significado del valor de en una distribución gausiana (Ver figura 11), podemos decir que el nivel de confianza de que el valor obtenido sea correcto es del 68.2 %, que representa la cantidad de probabilidad cubierta en el intervalo . De esta forma podemos hacer una clasificación en función del intervalo de error asumido
 

Determinación de los parámetros de máxima verosimilitud.

Imaginemos que tenemos una población caracterizada por la variable x con una distribución de densidad de probabilidad , donde  es un vector de parámetros asociados a la distribución de densidad de probabilidad que queremos estimar con máxima verosimilitud.

En primer lugar realizamos un muestreo de orden n de la variable estudiada x (x1,...,xn). A continuación creamos la función de máxima verosimilitud que consiste en el producto de todas las funciones de densidad de probabilidad para cada medida realizada, es decir
 

.                                  (39)
Una forma más afable de tratar la ecuación (39) es tomando logaritmos neperianos de modo que el producto se convierte en una suma tal que
.                          (40)
Los estimadores de máxima verosimilitud los calculamos minimizando la función logarítmica (40) es decir haciendo nula su primera derivada
 
.                                (41)
Resolviendo las ecuaciones algebraicas (41), para cada uno de los estimadores  de máxima verosimilitud, obtenemos las expresiones de los estadísticos máxima verosimilitud que debemos de utilizar .
Si desarrollamos por Taylor la función de máxima verosimilitud logarítmica (40) obtenemos que

El primer sumando representa el valor de l obtenido con los estimadores de máxima verosimilitud. El segundo sumando es por definición de máxima verosimilitud nulo (ver ecuación 41) y el tercer sumando lo podemos rescribir en forma matricial, por lo que

Si consideramos que hemos realizado muchas medidas, la forma que adquiere la matriz A es la siguiente

.

La matriz A se encuentra íntimamente relacionada con la matriz de covarianza C que se define como la matriz de las varianzas y covarianzas cuando realizamos una evaluación multiparamétrica. Consideremos para simplificar que queremos evaluar un dato caracterizado por dos parámetros , con una función de distribución

y una densidad de probabilidad

.

En este caso también podemos calcular los momentos de orden 0, 1 y 2 de nuestro dato bidimensional  en la forma
 

.              (42)
 
De este modo por la condición de normalización  y por la definición de valor medio . Los momentos del tipo 0,2, representan las variancias de los parámetros x1 y x2 como podemos ver a continuación

y
.

En general a los momentos de orden l,m con valores entre 1 y 2, en nuestro caso, se denominan covariancias y se denotan como cov(xi,xj) que nos dan unos coeficientes cij que podemos agrupar en forma de matriz y que constituye la matriz de covariancias
 

.                                    (43)
Las componentes de esta matriz cumplen que cij=cji por lo que es una matriz diagonal simétrica, las componentes  es decir representan las varianzas de los parámetros , por lo que en nuestro caso bidimensional tenemos que la matriz de covariancia será

 
 

.                               (44)
Retomemos a la matriz A después de haber introducido a la matriz de covariancia C. Como decíamos se puede demostrar que la relación existente entre estas dos matrices es

 
 

C=A-1.                                  (45)
Una vez conocida la matriz de covariancia podremos determinar los errores asociados a los resultados obtenidos por los estimadores de máxima verosimilitud .
 
La mejor forma de entender todo lo que hemos dicho hasta el momento es mediante un ejemplo. Consideremos una población gausiana en la que realizamos un muestreo de orden n para medir una variable aleatoria X caracterizada por una función de densidad de probabilidad gausiana , donde los parámetros de máxima verosimilitud de f que queremos estimar son el valor medio  y la desviación estándar . La función de máxima verosimilitud será según la ecuación (39)
,

aplicando logaritmos neperianos obtenemos que

.

Ahora minimizamos la función de máxima verosimilitud neperiana derivando e igualando a cero. Para  tendremos que

,

de donde obtenemos que el mejor estimador del valor medio  viene dado por

,
como ya sabíamos de antemano.
Para 
,

de donde obtenemos que el mejor estimador de la anchura de la distribución gausiana o por definición el error instrumental de la medida  viene dado por

.

Ahora calculemos la matriz de covarianza C para ello en primer lugar calculamos la matriz

,

donde las componentes serán

,

,

De modo que

.

Si calculamos su matriz inversa obtenemos la matriz de covarianza C de modo que

.

En definitiva la matriz de covarianza es en este caso

,

lo que significa que el error en la estimación del valor medio  viene dado por

y
.

Propagación de errores en las medidas de laboratorio.

Consideremos un conjunto de funciones genéricas , en general , que dependen de los parámetros experimentales x1,...,xn, los cuales consideramos como independientes y que tienen asociado un error de medida . Nuestro objetivo consiste en determinar como se propagan los errores de cada uno de los parámetros x1,...,x en nuestra función  con el fin de obtener el error asociado al valor de , esto es .

Si consideramos que los errores en las medidas  son muy pequeños en comparación de los valores medios medidos , podemos linealizar la función  por Taylor de modo que para una de las funciones, digamos la j, tendríamos que
 

.               (46)
Si definimos las componentes de un vector  como
,

podemos expresar nuestra función en forma lineal como
 

.                               (47)
 
donde T es la matriz
 
,

por la teoría de la linealidad de funciones multiparamétricas la matriz de covarianzas C asociada a nuestra función  será

.

Como las variables medidas en el laboratorio son variables independientes, sus covarianzas cruzadas o lo que es lo mismo para son nulas, por lo que la matriz de covarianza general tiene la forma diagonal
 

.     (48)
La expresión general anterior la podemos particularizar para una única función f de modo que el error propagado a dicha función vendrá dado por
 
.       (49)
La ecuación anterior se conoce como “ley de propagación de errores” y expresa de forma correcta la forma de evaluar como los errores de medida influyen en el error del resultado que depende de dichas medidas.
 
Simplifiquemos el problema considerando una función que depende de dos variables del tipo f(x,y) donde x e y son parámetros de laboratorio que podemos estimar mediante muestreo de modo que podemos saber los valores . La ecuación (49) nos dice que el error que vamos a propagar a la medida de f será
.              (50)
El problema de propagación de errores más simple que podemos llegar a tener es cuando nuestra función solo depende de una variable f(x), en este caso la propagación de errores vendría dada por la relación, muchas veces confundida con el concepto de derivada total, siguiente
.                (51)
Ejemplos de aplicación de la ley de la propagación de los errores.

Con el fin de clarificar la aplicación del método de propagación de los errores, vamos a utilizarlo para determinar la ecuación de error de diversas funciones mono o multidimensionales, que se suelen utilizar con frecuencia en el laboratorio.

Área
Para determinar el área A de una determinada pieza rectangular debemos de medir su base b y su altura h, de modo que la función área depende de las variables b y h, en la forma . Evidentemente nosotros podemos estimar los valores de las longitudes base y altura por muestreo de modo que podemos conocer fácilmente . Una vez conocemos estos parámetros si queremos estimar el área no tenemos más que aplicar la función considerando los valores estimados de la base y la altura de modo que
 
.
Si además queremos conocer el error asociado a este valor del área, debemos de aplicar el método de propagación de errores en la forma
.
Primero calculemos las derivadas parciales evaluadas en los valores estimados, es decir

,

de modo que sustituyendo en la ecuación de propagación del error (51) tenemos que

.

Si ahora multiplicamos y dividimos la segunda igualdad por el valor estimado del área , obtenemos como ecuación de error
 

.                      (52)
Concentración
En este caso la concentración depende de dos variables de laboratorio, el volumen V y la masa m en la conocida forma

.

Como antes nosotros podemos estimar los valores de la masa y el volumen por muestreo de modo que podemos conocer fácilmente . Una vez conocemos estos parámetros si queremos estimar la concentración no tenemos más que aplicar la función considerando los valores estimados de modo que

 

.
Si además queremos conocer el error asociado a este valor de la concentración, debemos de aplicar el método de propagación de errores en la forma

.

Calculemos las derivadas parciales evaluadas en los valores estimados, es decir
 

,

de modo que sustituyendo en la ecuación de propagación del error tenemos que

Si ahora multiplicamos y dividimos la segunda igualdad por el valor estimado de la concentración  , obtenemos como ecuación de error

.               (53)
pH
 
En este caso el pH depende de una variable de laboratorio, la concentración C
 
.

Antes hemos visto como evaluar el error asociado a la concentración, de modo que podemos estimar los valores . Una vez conocemos estos parámetros si queremos estimar la concentración no tenemos más que aplicar la función considerando los valores estimados de modo que

.

Si además queremos conocer el error asociado a este valor de pH, debemos de aplicar el método de propagación de errores en la forma
 

                   .
Calculemos la derivada evaluada en el valor estimado, es decir
,

de modo que sustituyendo en la ecuación de propagación del error tenemos que

.                                  (54)
Distancia interplanar dhkl
En este caso la distancia interplanar en una red cristalina viene gobernada por la ley de Bragg que depende en principio únicamente de una variable de laboratorio, el ángulo de dispersión .

.

El ángulo  lo podemos estimar mediante muestreo, obteniendo los parámetros . Una vez conocemos estos parámetros si queremos estimar la concentración no tenemos más que aplicar la función considerando los valores estimados de modo que

.

Si además queremos conocer el error asociado a este valor del reticulado dhkldebemos de aplicar el método de propagación de errores en la forma

.

Calculemos la derivada evaluada en el valor estimado, es decir

,

de modo que sustituyendo en la ecuación de propagación del error tenemos que

.
 
Si multiplicamos y dividimos por dhkl  llegamos a la expresión de propagación de error más simplificada
 
.                            (55)


Regresión Lineal Simple y Método de los Mínimos Cuadrados.

En el procedimiento de mínimos cuadrados solo se consideran mínimos cuadrados lineales, donde la palabra lineal significa que es modelo seleccionado es lineal respecto a los parámetros. El que sea lineal respecto a los parámetros significa que ningún parámetro en el modelo aparece como exponente o es multiplicado o dividido por cualquier otro parámetro. Por ejemplo los modelos

son lineales en los parámetros  , pero el modelo

no lo es porque el parámetro  aparece como un exponente.

Centrémonos en el modelo lineal simple que tiene la forma

i = 1,2,...,n

donde Yi es la i-ésima observación de la variable respuesta, la cual corresponde al i-ésimo valor xi de la variable de predicción. Llamaremos   al error aleatorio no observable asociado a Yi  y  a los parámetros incógnita que representan la ordenada en el origen y la pendiente respectivamente.

Cada observación Yi es una variable aleatoria compuesta por la suma de dos componentes; el término no aleatorio   y la componente aleatoria  representa la distancia vertical de la observación a la línea de regresión (tanto positiva como negativa) y debido a que es una variable aleatoria, cumple que

de donde se deduce que la varianza asociada a cada valor de Yi, independientemente del valor xi en el que nos encontremos vendrá dada por

.

Para obtener los estimadores de mínimos cuadrados de  , consideraremos los n pares de datos (xi, yi), donde los valores de y son las observaciones de la variable aleatoria respuesta. El método de mínimos cuadrados considera la desviación de la observación yi de su valor medio y determina los valores de   que minimizan la suma de los cuadrados de estas desviaciones. La i-ésima desviación o error es

de modo que la suma de los cuadrados de los errores será
 

 

                   (56)


Los estimadores de mínimos cuadrados de   se obtienen mediante la diferenciación de (56) con respecto a   e igualando a cero cada derivada parcial, es decir

y
,

donde   son los estimadores por mínimos cuadrados de  . Simplificando las ecuaciones anteriores llegamos al sistema de ecuaciones
 

                          (57)

 
 

A partir de las ecuaciones (57) y de los datos experimentales (yi, xi), podemos obtener los valores de los estimadores   en la forma
 
 

                (58)
y
                         (59)


 que son respectivamente las ecuaciones de la ordenada en el origen y de la pendiente de la recta de regresión de los datos experimentales (xi, yi).
 

Errores de las estimaciones

Recordemos que la varianza  de la variable respuesta Y es igual a la varianza del error  que sabemos es constante para todos los valores de la variable x. En general, debido a que el valor de   no se conoce, podemos estimarlo a partir de los estimadores de mínimos cuadrados  . Sea  el valor predicho o promedio en el punto xi por los estimadores   (Valor dado para y en la regresión). La diferencia   representa la desviación de Yrespecto a su propia media. La suma de los cuadrados de estas diferencias, divididas por una constantes apropiada, es la forma en que se determina una varianza. Las diferencias   se conocen como residuos, de modo que la suma de los cuadrados de los residuos dividida por una constante es un estimador de  . La constante apropiada en n-2, ya que se pierden dos grados de libertad al tener que estimar los dos parámetros   antes de obtener  . Este estimador se denota como s2 y viene dado por la expresión

.                                    (60)


 Este valor nos representa el error medio que tenemos en un determinado valor de Y interpolado. De esta forma a cada valor de Y obtenido por mínimos cuadrados, es decir  , tendrá asociado un error que será   . La figura 13 nos aclara el significado de este valor.
 
 


Figura 13. Significado del residuo

Ya hemos conseguido calcular los valores de los estimadores de la ordenada en el origen y la pendiente  y por tanto la ecuación de ajuste o regresión más probable para la distribución de puntos experimentales (xi, yi) que adquiere la forma
 

                                  (61)


 Además hemos podido estimar el error medio asociado a cada valor interpolado   es decir  . Nos quedan por determinar los estimadores de los errores cometidos en las estimaciones de  así como el coeficiente de correlación del ajuste r.

Basándose en el teorema de Gauss-Markov, que no vamos a demostrar, se llegan a las siguientes expresiones para los errores de  ,
 
 

.                           (62)


Coeficiente de Correlación lineal

En todo lo que hemos dicho hasta el momento, hemos asumido la disponibilidad de una muestra aleatoria de la variable respuesta Y1, Y2, ..., Yn, correspondientes a n valores fijos x1, x2..., xn de una variable predicción. Para definir el coeficiente de correlación, supondremos que tanto X como Y son variables aleatorias. Si consideramos que las distribuciones de los valores X e Y siguen distribuciones normales y constituyen una muestra de orden n de la distribución, puede demostrarse que el estimador de máxima verosimilitud de r, llamado coeficiente de correlación viene dado por la expresión
 

 

.                     (63)


 El coeficiente de correlación r se encuentra en el intervalo –1 < r < 1 y nos mide la relación lineal existente entre los valores X e Y. Un valor de r = -1 nos indica una relación lineal negativa perfecta entre X e Y, mientras que un valor de r = 1 nos indicará una relación lineal positiva perfecta entre X e Y. Si r = 0, entonces no existe ninguna relación lineal entre X e Y. La figura 14 muestra algunos casos posibles de correlaciones.


Figura 14. Ejemplos de correlación

 

@ RFR. 25 de Julio de 2004