
“ MÉTODOS ESTADÍSTICOS BÁSICOS EN EL LABORATORIO”Probabilidad P(x). Función de distribución de probabilidad F(x). Densidad de probabilidad f(x). Momentos . Momento de orden 0 (
),Normalización. Momento de orden 1 (
), Valor medio. Momento de orden 2 (
), Varianza
. Momento de orden 3 (
), Sesgo.
Distribución de probabilidad uniforme y la medida digital. Distribución de probabilidad binomial y la estadística del contaje. Distribución de probabilidad gausiana
.
Muestreo de poblaciones gausianas (parámetros de laboratorio). Estimadores fieles y consistentes. Error en una medida e intervalos de confianza. Determinación de los parámetros de máxima verosimilitud.Propagación de errores en las medidas de laboratorio. Ejemplos de aplicación de la ley de la propagación de los errores: área, concentración, pH, distancia interplanar dhkl .
Regresión Lineal Simple y Método de los Mínimos Cuadrados. Errores de las estimaciones. Correlación lineal.
Cuando nosotros realizamos un experimento, realmente estamos siguiendo un procedimiento previamente descrito como consecuencia del cual obtenemos una cantidad o cantidades que constituyen la medida de una determinada magnitud. El espacio de muestras lo forma el conjunto de resultados obtenidos u obtenibles en un experimento. Por ejemplo en la media de un área rectangular, nosotros medimos dos parámetros la base b y la altura h, de modo que el espacio de muestras asociado a la medida del área de un rectángulo será el conjunto de valores reales positivos de la base y de la altura, esto es,
. La figura 1 muestra el espacio de muestras asociado a la medida de un área.
![]()
Figura 1. Espacio de muestras en la medida de un área.
Un suceso A es un conjunto de resultados posibles que constituye un subespacio del espacio de muestras. Por ejemplo si nosotros medimos el área de un rectángulo de base b = 2 cm con un error de
y una altura h = 3 cm con un error
, el suceso asociado será el conjunto de valores tales que b este comprendido entre 1.9 y 2.1 cm y h entre 2.8 y 3.2 cm. La figura 2 muestra la representación de un suceso área de valor A = 6 cm2 en el espacio de muestras asociado.
![]()
Figura 2. Suceso en el espacio de muestras de un área.Si en la determinación de un suceso A realizamos N experimentos de los cuales n dan el suceso A, la probabilidad de que dicho suceso ocurra será
. (1)
Démonos cuenta de que la definición formal de la probabilidad está definida para un número infinito de experimentos. En el laboratorio el número de experimentos siempre es finito por lo que el valor que podemos obtener para la probabilidad de que un suceso A suceda, siempre será una estimación de su valor real
. Si realizamos un número razonable de experimentos, el valor de la estimación de la probabilidad tiende a aproximarse a su valor verdadero.
Una práctica muy instructiva sobre este tema es la siguiente. Sabemos que un dado tiene seis caras, cada una con un valor del 1 al 6. En principio, si el dado es perfecto, la probabilidad de que salga el valor 1, 2, 3 o cualquiera de ellos es. Si eso es verdad vamos a estimar el valor de la probabilidad de que nos salga por ejemplo el valor 5, es decir vamos ha diseñar un proceso para estimar
, que sabemos debe de ser
. Nuestro experimento serán lanzar el dado, de modo que el número de experimentos N será el número de lanzamientos que realicemos. Cuando nos salga un valor 5, lo anotaremos y veremos cuantas veces ocurre en los N experimentos realizados. Una vez realizados los N experimentos, estimaremos el valor de la probabilidad de que salga un 5 mediante la fórmula
Si el número de experimentos es pequeño (1 < N < 30), vemos que el valor que obtenemos parano se parece en nada al real
. Si seguimos realizando experimentos hasta valores elevados de N (100 < N < 500), vemos como el valor de la probabilidad estimada
tiende al valor real
. Yo recomendaría que se hiciese la práctica aquí propuesta para comprobar por uno mismo que lo dicho es cierto y para familiarizarse con el concepto de probabilidad.
Función de distribución de probabilidad F(x).
Si las variables o parámetros que estamos evaluando son continuos o lo que es lo mismo hemos realizado un número de experimentos N muy grande, podemos definir la función de distribución F(x) como la probabilidad de que la variable aleatoria
adquiera un valor inferior a x,
. (3)
De la ecuación (1) sabemos que el intervalo de valores que puede adquirir la probabilidad y por tanto la función F(x) varía entre 0 y 1. La figura 3 nos muestra el aspecto de la función F(x).
Figura 3. Función de distribución F(x). Algunas de las propiedades que podemos apreciar de la función F(x) son las siguientes:(1)- F(x) es monótona y siempre creciente.(2)- Para x tendiendo a infinito la probabilidad total o el valor de F(x) tiende a 1,. (4)
(3)- La probabilidad de quesea superior o igual a x será
(4)- Si hacemos tender x a menos infinito la probabilidad o el valor de F(x) tiende a 0, . (5)
. (6)
Densidad de probabilidad f(x)La densidad de probabilidad f(x) expresa la cantidad de probabilidad por unidad de variable y en términos diferenciales la podemos representar como
. (7)
Podemos apreciar que el concepto de densidad de probabilidad adquiere sentido si la variable aleatoriaes continua. Consideremos que la densidad de probabilidad tiene la forma que muestra la figura 4, una distribución de densidad típicamente gausiana
![]()
Figura 4. Densidad de probabilidad gausiana.
La probabilidad total que hemos definido por el valor 1, deberá ser de ser el área total encerrada por la función de densidad de probabilidad, es decir, deberá de cumplirse la condición de normalización
. (8)
Conocida la distribución de densidad de probabilidad, podemos deducir muchos parámetros importantes por ejemplo el valor medio en una medida. Como podemos suponer corresponderá al centro de gravedad de la función de densidad de probabilidad, es decir,
. (9)
Conocida la función de densidad de probabilidad, la función de distribución F(x) se encuentra perfectamente definida, de modo que. (10)
![]()
Figura 5. El área rayada corresponde a la probabilidad de que x < a.Si queremos conocer la probabilidad de que una variable se encuentre comprendida entre un rango de valores a y b, solo tendremos que calcular la probabilidad de que la variable x sea menor que b, esto es F(b) y restarle la probabilidad de que la variable x sea menor que a. En lenguaje matemático esto se traduce en. (11)
![]()
Figura 6. El área rayada corresponde a la probabilidad de que a < x < b.Cuando en el laboratorio se realizan múltiples medidas de un parámetro determinado, digamos, lo que obtenemos es una serie de valores x que pueden encontrarse muy cerca del valor
pero no tienen por que ser
. Si representamos en forma de histograma los resultados de los N experimentos realizados para la determinación del parámetro
, es decir representamos en el eje y la frecuencia o el número de veces que obtenemos un determinado valor x frente al valor medido experimentalmente de x, se genera una imagen de la forma que tiene la función densidad de probabilidad f(x) asociada a la variable
que estamos estudiando. Esta claro que cuanto mayor sea el número de experimentos N que realicemos mejor definida se encontrara dicha función f(x). En el límite en el que N tienda a infinito la envolvente del histograma tenderá a la función de densidad de probabilidad.
Si realizásemos sucesivas medidas del grosor de un libro, podríamos obtener un histograma tal y como el que muestra la figura 5 donde hemos representado las sucesivas medidas del grosor del libro y una estimación de la función de densidad de probabilidad asociada a la variable grosor del libro.En azul la envolvente del histograma o función de densidad asociada f(x). La forma de calcular el valor medio
![]()
Figura 7. Histograma de la medida del grosor de un libro.hemos visto que era en el caso continuo mediante la ecuación (9). El paso del continuo al discreto se traduce matemáticamente en el paso de la integral a un sumatorio, de modo que la mejor estimación del valor medio
que podemos hacer será
. (12)
Los momentos en estadística se definen mediante la ecuación general, (13)
dondees el orden del momento evaluado.
Si calculamos a partir de la ecuación (13) el momento de orden 0, obtenemos que
pero como vimos en la ecuación (8),, por lo que llegamos a la conclusión de que el momento de orden 0 nos da la condición de normalización de nuestra función de densidad de probabilidad
. (14)
Si ahora calculamos a partir de la ecuación (13) el momento de orden 1, obtenemos que.
Esta claro que la integral
, que representa el valor medio del valor medio, nos da el valor medio
. Si recordamos la definición de valor medio (9) nos damos cuenta de que la primera integral
es, por definición el valor medio
. Por lo tanto el primer momento es nulo
. (15)
El momento de orden 2 nos habla de la dispersión de valores alrededor del valor medio,
. (16)
La varianzala definimos como el valor del momento
. Las unidades de la varianza corresponden al cuadrado de las unidades del valor medio. Por esta razón se utiliza el parámetro desviación estándar o típica como
, (17)
de modo que las dimensiones de la desviación estándarPor definición el error en la medida de una cantidad es la desviación estándar de la variable medida, coincidan con las del valor medio
.
. El significado geométrico del parámetro
coincide aproximadamente con la semi anchura de la distribución de densidad de probabilidad de la medida. De hecho, veremos que para una distribución de densidad gausiana (variables de laboratorio), el área o probabilidad que cubre el
correspondiente es del 68.2 % del total. Por tanto podremos decir con un 68.2 % de certeza que el valor de nuestra medida será
, (18)
El momento de orden 3 nos habla de la simetría de la dispersión de los valores alrededor del valor medio
,
. (19)
Para ponderar la magnitud de simetría y normalizar de forma adimensional este parámetro, definimos el sesgocomo el cociente entre el tercer momento y la desviación típica al cubo
. (20)
La figura 8 nos muestra el significado del parámetro sesgo respecto a la distribución de densidad de probabilidad que lo genera.![]()
Figura 8. Densidad de probabilidad con distintos sesgos.Una medida digital de una variable x, posee una distribución de densidad de probabilidad discretizada que podemos expresar como
. (21)
![]()
Figura 9. Densidad de probabilidad en una distribución uniforme.Lo que esta distribución de densidad de probabilidad nos indica es que en una medida digital nuestra medida o se encuentra en el intervalo (a,b) o se encuentra fuera. La longitud del intervalo representa los alrededores del último dígito en cualquier aparato digital. Por ejemplo en una balanza de cuatro cifras decimales de gramo, será el entorno comprendido entre 0.00005 g y –0.00005 g, para una masa media de 0.0000 g. Si aplicamos lo que sabemos hasta el momento, podemos deducir los parámetros más significativos en este tipo de medidas. Veamos en primer lugar el valor de la constante C. De la condición de normalización de la probabilidad (8) sabemos que,
de donde vemos que. (22)
El valor mediosabemos que viene dado por la expresión (9), es decir,
,
de donde obtenemos que. (23)
La varianzala calculamos a partir del segundo momento, de modo que
,
lo que nos da como resultado. (24)
Por definición, el error en la medida digital dado por (17) será, (25)
donde L es el intervalo de medida más pequeño que nuestro aparato digital es capaz de ofrecernos.Por ejemplo cuando medimos un voltaje con un polímetro digital y obtenemos el valor 2 . 2 3 voltios, podemos darnos cuenta de que la última cifra sigue una distribución uniforme por lo que podemos asegurar que el error de nuestra medida será de.
Esta distribución es de suma importancia en muchos procesos físicos que suceden en el laboratorio, sobre todo en lo que se refiere a equilibrios termodinámicos y muy especialmente a la interpretación de los espectros.Supongamos que hacemos un experimento y estamos interesados en saber si sucede o no sucede el suceso A. Si sucede lo hará con una probabilidad p, si no sucede la probabilidad será 1-p. Definimos la variable xi de forma que adquiere el valor 1 si sucede y un valor 0 si no sucede. Si realizamos n veces el experimento podemos crear la variable X cuyo significado sea el número de veces que ocurre el suceso A en la forma.
En estas condiciones podemos afirmar que la variable X sigue una distribución de probabilidad binomial P(x=k) que viene dada por. (26)
La distribución de probabilidad binomial, cumple la condición de normalización.
El valor medio de una distribución binomial, será según la ecuación (12),
es decir. (27)
De forma discreta la varianza la podemos definir mediante la expresión, (28)
de modo que para la distribución binomial que es discreta, podemos buscar el valor de la varianza en la forma,
de donde obtenemos que la varianza en una distribución binomial es
. (29)
El error en una media de una variable binomial será. (30)
Un espectro multicanal, consiste en una serie de canales discretos que representan en forma de histograma el número de cuentas, fotones, partículas etc... que se reciben a cada energía, como podemos ver en la figura 10.![]()
Figura 10. Espectro de dispersión de energía de rayos X. En el eje y número de cuentas. En el eje x energía.
Si analizamos uno cualquiera de los canales, podemos definir los sucesos xi contar un fotón con probabilidad p y no contarlo con probabilidad 1-p, de modo que realizando n medidas o experimentos podemos construir la variable número de fotones detectados.
Por construcción nos damos cuenta de que la variable N número de fotones detectados, sigue una distribución binomial, por lo que el error de contaje en dicho canal será según la ecuación (30)
.
La medida de la intensidad, numero de cuentas o altura de un pico cualquiera, I tendrá por tanto asociado un error de contaje proporcional a la raíz cuadrada de dicha intensidad.La importancia manifiesta de esta distribución radica en que la inmensa mayoría de las variables que se miden en el laboratorio siguen una distribución de densidad de probabilidad gausiana. Normalmente a esta distribución se la caracteriza mediante los parámetros valor medio de la distribucióny desviación estándar
, diciendo que la variable sigue una distribución normal o gausiana de parámetros
y
. Analíticamente esta distribución tiene la forma
. (31)
Gráficamente representa la conocida campana de Gauss que vemos en la figura 11.![]()
Figura 11. Densidad de probabilidad gausiana.Estrictamente la función de densidad gausiana nunca se anula pero se suele considerar nulaa partir de los valores
.
La función de distribución F(x) asociada a la densidad de probabilidad gausiana por definición será, (32)
Cuyo aspecto podemos apreciar en la figura 12![]()
Figura 12. Distribución de probabilidad gausiana.Si calculamos la probabilidad de obtener un valor mediocon una error de
, sabemos que según la ecuación (11)
lo que nos da una probabilidad del 68.2 %. Si calculamos de la misma forma la probabilidad de obtener un valor mediocon una error de
obtenemos un 95.4 % y si lo hacemos para
la probabilidad es casi total con un 99.8 %.
El muestreo consiste en la técnica de cómo obtener información de lo que uno está midiendo a través de la medida repetitiva de los parámetros que la caracterizan. Si queremos medir una cantidad cuyo valor real es m0 , podemos definir como variable aleatoria x la medida que hacemos de m0. Si el aparato de medida que estamos utilizando es suficientemente lineal y estable, cabe esperar que el valor medio de las medidas sea m0, esto esy su error sea el de la medida
.
Si repetimos n veces la medida (x1,x2,...,xn) podemos obtener mucha más información. Se dice que el conjunto de valores (x1,x2,...,xn) es una muestra de orden n de m0 o de la población. La población será el conjunto de infinitos valores que tomaría la variable x al repetir infinitas veces el experimento. De este modo una muestra es un subespacio de la población. Por ejemplo imaginemos que queremos saber la edad de los alumnos de una clase. La población serían todas las edades posibles de los alumnos y una muestra la constituiría considerar la edad de unos cuantos escogidos aleatoriamente, por ejemplo 10 alumnos. El resultado tomará un intervalo de valores posibles (e.j. 20-30 años). Estos datos son representativos de la población que puede ser por ejemplo de 200 alumnos.
En un proceso de medida repetitiva las variables medidas deben de ser independientes y además las densidades de probabilidad de las variables deben de ser las mismas. Esto significa que si por ejemplo estamos midiendo en número de bolas rojas que hay en una urna de bolas rojas y azules, la medida será sacar una bola y mirar su color y además devolveremos la bola medida a la urna antes de realizar una nueva medida para que la probabilidad de que saquemos una azul o roja sea la misma.
Un estimador es un estadístico que nos sirve para estimar un determinado parámetro de la población s = s(x1,x2,...,xn).
Un estimador será fiel si el valor medio del estimador s coincide con el valor real de la población
. Lo cerca o lejos que se encuentre el valor medio del estimador respecto al valor real vendrá dado por el error de la medida. En primera instancia cuanto mayor sea el orden de la muestra, menor será el error en la medida.
Un estimador será consistente si en el límite en el que el número de medidas tiende a infinito su varianza tiende a cero, es decir,
. (33)
Evaluemos la fidelidad y consistencia del estimador media aritmética. Como todos sabemos este estimador viene dado por la expresión
. (34)
Primero evaluaremos su fidelidad, calculando su valor medio,
podemos decir que este estimador es fiel.Analicemos ahora la consistencia de este estimador. Para ello calcularemos su varianza a partir de la definición del segundo momento estadístico
![]()
Los sumandos del primer sumatorio, por definición de segundo momento, representan las varianzas de cada una de las medidas, que sabemos que son constantes (o error del instrumento). Los sumandos del segundo sumatorio doble representan las covarianzas de las medidas, que hemos supuesto independientes lo que significa que su valor es cero. De esta forma obtenemos que
.
Podemos apreciar que en el límite n infinito la varianza del estimador media aritmética tiende a cero por lo que podemos asegurar que este estimador es consistente.Operando un poco más obtenemos cual es el error de nuestro muestreo de orden n, (35)
donde n es el número de medidas que hemos realizado yes el error instrumental de nuestro aparato.
El valor decorresponde a la varianza asociada a nuestro muestreo
o lo que es lo mismo al error instrumental de nuestro equipo de medida. Su estimación en poblaciones gausianas la podemos realizar mediante el estimador RMS que viene definido por la expresión
. (36)
En resumen podemos decir que “en poblaciones gausianas o de laboratorio” en muestreos de orden n los estimadores más importantes son los siguientes
Error en una medida e intervalos de confianza.
Según lo que hemos visto en el apartado de muestreo en poblaciones gausianas, el resultado más fiel y consistente viene dado por el valor medio
,
.
El error asociado a este valor si el muestreo realizado es de orden n será
,
,
donde
es el error instrumental que podemos estimar mediante la expresión
.
De este modo podemos rescribir el error asociado a nuestro muestreo en la forma
. (37)
El valor medido vendrá dado por el valor medio más menos el error de muestreo esto es. (38)
Si tenemos en cuenta el significado del valor deen una distribución gausiana (Ver figura 11), podemos decir que el nivel de confianza de que el valor obtenido sea correcto es del 68.2 %, que representa la cantidad de probabilidad cubierta en el intervalo
. De esta forma podemos hacer una clasificación en función del intervalo de error asumido
Determinación de los parámetros de máxima verosimilitud.
Imaginemos que tenemos una población caracterizada por la variable x con una distribución de densidad de probabilidad
, donde
es un vector de parámetros asociados a la distribución de densidad de probabilidad que queremos estimar con máxima verosimilitud.
En primer lugar realizamos un muestreo de orden n de la variable estudiada x (x1,...,xn). A continuación creamos la función de máxima verosimilitud que consiste en el producto de todas las funciones de densidad de probabilidad para cada medida realizada, es decir
. (39)
Una forma más afable de tratar la ecuación (39) es tomando logaritmos neperianos de modo que el producto se convierte en una suma tal que. (40)
Los estimadores de máxima verosimilitud los calculamos minimizando la función logarítmica (40) es decir haciendo nula su primera derivada. (41)
Resolviendo las ecuaciones algebraicas (41), para cada uno de los estimadoresde máxima verosimilitud, obtenemos las expresiones de los estadísticos máxima verosimilitud que debemos de utilizar
.
Si desarrollamos por Taylor la función de máxima verosimilitud logarítmica (40) obtenemos queEl primer sumando representa el valor de l obtenido con los estimadores de máxima verosimilitud. El segundo sumando es por definición de máxima verosimilitud nulo (ver ecuación 41) y el tercer sumando lo podemos rescribir en forma matricial, por lo que
Si consideramos que hemos realizado muchas medidas, la forma que adquiere la matriz A es la siguiente
.
La matriz A se encuentra íntimamente relacionada con la matriz de covarianza C que se define como la matriz de las varianzas y covarianzas cuando realizamos una evaluación multiparamétrica. Consideremos para simplificar que queremos evaluar un dato caracterizado por dos parámetros
, con una función de distribución
y una densidad de probabilidad
.
En este caso también podemos calcular los momentos de orden 0, 1 y 2 de nuestro dato bidimensional
en la forma
. (42)
De este modo por la condición de normalizacióny por la definición de valor medio
. Los momentos del tipo 0,2, representan las variancias de los parámetros x1 y x2 como podemos ver a continuación
y.
En general a los momentos de orden l,m con valores entre 1 y 2, en nuestro caso, se denominan covariancias y se denotan como cov(xi,xj) que nos dan unos coeficientes cij que podemos agrupar en forma de matriz y que constituye la matriz de covariancias
. (43)
Las componentes de esta matriz cumplen que cij=cji por lo que es una matriz diagonal simétrica, las componenteses decir representan las varianzas de los parámetros
, por lo que en nuestro caso bidimensional tenemos que la matriz de covariancia será
. (44)
Retomemos a la matriz A después de haber introducido a la matriz de covariancia C. Como decíamos se puede demostrar que la relación existente entre estas dos matrices es
C=A-1. (45)Una vez conocida la matriz de covariancia podremos determinar los errores asociados a los resultados obtenidos por los estimadores de máxima verosimilitud.
La mejor forma de entender todo lo que hemos dicho hasta el momento es mediante un ejemplo. Consideremos una población gausiana en la que realizamos un muestreo de orden n para medir una variable aleatoria X caracterizada por una función de densidad de probabilidad gausiana, donde los parámetros de máxima verosimilitud de f que queremos estimar son el valor medio
y la desviación estándar
. La función de máxima verosimilitud será según la ecuación (39)
,
aplicando logaritmos neperianos obtenemos que
.
Ahora minimizamos la función de máxima verosimilitud neperiana derivando e igualando a cero. Para
tendremos que
,
de donde obtenemos que el mejor estimador del valor medio
viene dado por
,
como ya sabíamos de antemano.Para,
de donde obtenemos que el mejor estimador de la anchura de la distribución gausiana o por definición el error instrumental de la medida
viene dado por
.
Ahora calculemos la matriz de covarianza C para ello en primer lugar calculamos la matriz
,
donde las componentes serán
,
,
De modo que
.
Si calculamos su matriz inversa obtenemos la matriz de covarianza C de modo que
.
En definitiva la matriz de covarianza es en este caso
,
lo que significa que el error en la estimación del valor medio
viene dado por
y.
Propagación de errores en las medidas de laboratorio.
Consideremos un conjunto de funciones genéricas
, en general
, que dependen de los parámetros experimentales
x1,...,xn, los cuales consideramos como independientes y que tienen asociado un error de medida
. Nuestro objetivo consiste en determinar como se propagan los errores de cada uno de los parámetros
x1,...,xn en nuestra función
con el fin de obtener el error asociado al valor de
, esto es
.
Si consideramos que los errores en las medidas
son muy pequeños en comparación de los valores medios medidos
, podemos linealizar la función
por Taylor de modo que para una de las funciones, digamos la j, tendríamos que
. (46)
Si definimos las componentes de un vectorcomo
,
podemos expresar nuestra función en forma lineal como
. (47)
donde T es la matriz,
por la teoría de la linealidad de funciones multiparamétricas la matriz de covarianzas C asociada a nuestra función
será
.
Como las variables medidas en el laboratorio son variables independientes, sus covarianzas cruzadas o lo que es lo mismo para
son nulas, por lo que la matriz de covarianza general tiene la forma diagonal
. (48)
La expresión general anterior la podemos particularizar para una única función fj de modo que el error propagado a dicha función vendrá dado por. (49)
La ecuación anterior se conoce como “ley de propagación de errores” y expresa de forma correcta la forma de evaluar como los errores de medida influyen en el error del resultado que depende de dichas medidas.
Simplifiquemos el problema considerando una función que depende de dos variables del tipo f(x,y) donde x e y son parámetros de laboratorio que podemos estimar mediante muestreo de modo que podemos saber los valores. La ecuación (49) nos dice que el error que vamos a propagar a la medida de f será
. (50)
El problema de propagación de errores más simple que podemos llegar a tener es cuando nuestra función f solo depende de una variable f(x), en este caso la propagación de errores vendría dada por la relación, muchas veces confundida con el concepto de derivada total, siguienteEjemplos de aplicación de la ley de la propagación de los errores.. (51)
Con el fin de clarificar la aplicación del método de propagación de los errores, vamos a utilizarlo para determinar la ecuación de error de diversas funciones mono o multidimensionales, que se suelen utilizar con frecuencia en el laboratorio.
Para determinar el área A de una determinada pieza rectangular debemos de medir su base b y su altura h, de modo que la función área depende de las variables b y h, en la forma. Evidentemente nosotros podemos estimar los valores de las longitudes base y altura por muestreo de modo que podemos conocer fácilmente
. Una vez conocemos estos parámetros si queremos estimar el área no tenemos más que aplicar la función considerando los valores estimados de la base y la altura de modo que
.
Si además queremos conocer el error asociado a este valor del área, debemos de aplicar el método de propagación de errores en la forma.
Primero calculemos las derivadas parciales evaluadas en los valores estimados, es decir![]()
,
de modo que sustituyendo en la ecuación de propagación del error (51) tenemos que
.
Si ahora multiplicamos y dividimos la segunda igualdad por el valor estimado del área
, obtenemos como ecuación de error
. (52)
En este caso la concentración depende de dos variables de laboratorio, el volumen V y la masa m en la conocida forma
.
Como antes nosotros podemos estimar los valores de la masa y el volumen por muestreo de modo que podemos conocer fácilmente
. Una vez conocemos estos parámetros si queremos estimar la concentración no tenemos más que aplicar la función considerando los valores estimados de modo que
.
Si además queremos conocer el error asociado a este valor de la concentración, debemos de aplicar el método de propagación de errores en la forma
.
Calculemos las derivadas parciales evaluadas en los valores estimados, es decir![]()
,
de modo que sustituyendo en la ecuación de propagación del error tenemos que
Si ahora multiplicamos y dividimos la segunda igualdad por el valor estimado de la concentración
, obtenemos como ecuación de error
. (53)
En este caso el pH depende de una variable de laboratorio, la concentración C.
Antes hemos visto como evaluar el error asociado a la concentración, de modo que podemos estimar los valores
. Una vez conocemos estos parámetros si queremos estimar la concentración no tenemos más que aplicar la función considerando los valores estimados de modo que
.
Si además queremos conocer el error asociado a este valor de pH, debemos de aplicar el método de propagación de errores en la forma
.
Calculemos la derivada evaluada en el valor estimado, es decir,
de modo que sustituyendo en la ecuación de propagación del error tenemos que
. (54)
En este caso la distancia interplanar en una red cristalina viene gobernada por la ley de Bragg que depende en principio únicamente de una variable de laboratorio, el ángulo de dispersión.
.
El ángulo
lo podemos estimar mediante muestreo, obteniendo los parámetros
. Una vez conocemos estos parámetros si queremos estimar la concentración no tenemos más que aplicar la función considerando los valores estimados de modo que
.
Si además queremos conocer el error asociado a este valor del reticulado dhkldebemos de aplicar el método de propagación de errores en la forma
.
Calculemos la derivada evaluada en el valor estimado, es decir
,
de modo que sustituyendo en la ecuación de propagación del error tenemos que
.
Si multiplicamos y dividimos por dhkl llegamos a la expresión de propagación de error más simplificada. (55)
Regresión Lineal Simple y Método de los Mínimos Cuadrados.En el procedimiento de mínimos cuadrados solo se consideran mínimos cuadrados lineales, donde la palabra lineal significa que es modelo seleccionado es lineal respecto a los parámetros. El que sea lineal respecto a los parámetros significa que ningún parámetro en el modelo aparece como exponente o es multiplicado o dividido por cualquier otro parámetro. Por ejemplo los modelos
son lineales en los parámetros
, pero el modelo
no lo es porque el parámetro
aparece como un exponente.
Centrémonos en el modelo lineal simple que tiene la forma
i = 1,2,...,n
donde Yi es la i-ésima observación de la variable respuesta, la cual corresponde al i-ésimo valor xi de la variable de predicción. Llamaremos
al error aleatorio no observable asociado a Yi y
a los parámetros incógnita que representan la ordenada en el origen y la pendiente respectivamente.
Cada observación Yi es una variable aleatoria compuesta por la suma de dos componentes; el término no aleatorio
y la componente aleatoria
.
representa la distancia vertical de la observación a la línea de regresión (tanto positiva como negativa) y debido a que es una variable aleatoria, cumple que
de donde se deduce que la varianza asociada a cada valor de Yi, independientemente del valor xi en el que nos encontremos vendrá dada por
.
Para obtener los estimadores de mínimos cuadrados de
, consideraremos los n pares de datos (xi, yi), donde los valores de y son las observaciones de la variable aleatoria respuesta. El método de mínimos cuadrados considera la desviación de la observación yi de su valor medio y determina los valores de
que minimizan la suma de los cuadrados de estas desviaciones. La i-ésima desviación o error es
de modo que la suma de los cuadrados de los errores será
(56)
Los estimadores de mínimos cuadrados dese obtienen mediante la diferenciación de (56) con respecto a
e igualando a cero cada derivada parcial, es decir
y
,
donde
son los estimadores por mínimos cuadrados de
. Simplificando las ecuaciones anteriores llegamos al sistema de ecuaciones
(57)
A partir de las ecuaciones (57) y de los datos experimentales (yi, xi), podemos obtener los valores de los estimadores
en la forma
y(58)
(59)
que son respectivamente las ecuaciones de la ordenada en el origen y de la pendiente de la recta de regresión de los datos experimentales (xi, yi).
Recordemos que la varianza
de la variable respuesta Y es igual a la varianza del error
que sabemos es constante para todos los valores de la variable x. En general, debido a que el valor de
no se conoce, podemos estimarlo a partir de los estimadores de mínimos cuadrados
. Sea el valor predicho o promedio en el punto xi por los estimadores
(Valor dado para y en la regresión). La diferencia
representa la desviación de Yi respecto a su propia media. La suma de los cuadrados de estas diferencias, divididas por una constantes apropiada, es la forma en que se determina una varianza. Las diferencias
se conocen como residuos, de modo que la suma de los cuadrados de los residuos dividida por una constante es un estimador de
. La constante apropiada en n-2, ya que se pierden dos grados de libertad al tener que estimar los dos parámetros
antes de obtener
. Este estimador se denota como s2 y viene dado por la expresión
. (60)
Este valor nos representa el error medio que tenemos en un determinado valor de Y interpolado. De esta forma a cada valor de Y obtenido por mínimos cuadrados, es decir, tendrá asociado un error que será
. La figura 13 nos aclara el significado de este valor.
![]()
Figura 13. Significado del residuoYa hemos conseguido calcular los valores de los estimadores de la ordenada en el origen y la pendiente y por tanto la ecuación de ajuste o regresión más probable para la distribución de puntos experimentales (xi, yi) que adquiere la forma
(61)
Además hemos podido estimar el error medio asociado a cada valor interpoladoes decir
. Nos quedan por determinar los estimadores de los errores cometidos en las estimaciones de
así como el coeficiente de correlación del ajuste r.
Basándose en el teorema de Gauss-Markov, que no vamos a demostrar, se llegan a las siguientes expresiones para los errores de
,
. (62)
Coeficiente de Correlación linealEn todo lo que hemos dicho hasta el momento, hemos asumido la disponibilidad de una muestra aleatoria de la variable respuesta Y1, Y2, ..., Yn, correspondientes a n valores fijos x1, x2..., xn de una variable predicción. Para definir el coeficiente de correlación, supondremos que tanto X como Y son variables aleatorias. Si consideramos que las distribuciones de los valores X e Y siguen distribuciones normales y constituyen una muestra de orden n de la distribución, puede demostrarse que el estimador de máxima verosimilitud de r, llamado coeficiente de correlación viene dado por la expresión
. (63)
El coeficiente de correlación r se encuentra en el intervalo –1 < r < 1 y nos mide la relación lineal existente entre los valores X e Y. Un valor de r = -1 nos indica una relación lineal negativa perfecta entre X e Y, mientras que un valor de r = 1 nos indicará una relación lineal positiva perfecta entre X e Y. Si r = 0, entonces no existe ninguna relación lineal entre X e Y. La figura 14 muestra algunos casos posibles de correlaciones.
![]()
![]()
Figura 14. Ejemplos de correlación
@ RFR. 25 de Julio de 2004