Paginas de docencia de Joaquina de la Torre Escudero

GENÉTICA MENDELIANA EN POBLACIONES – EL PRINCIPIO DE EQUILIBRIO HARDY-WEINBERG

La piedra angular de la genética de poblaciones es un modelo básico – el modelo de equilibrio Hardy-Weinberg – que analiza la dinámica de las frecuencias génicas y genotípicas en una población ideal, que cumple las siguientes premisas: 

1.       El organismo en cuestión es diploide

2.       La reproducción es sexual

3.       Las generaciones son discretas (no hay solapamiento de generaciones)

4.       El apareamiento es aleatorio

5.       El tamaño poblacional  es muy grande (infinito desde un punto de vista estadístico)

6.       La migración es despreciable

7.       La mutación puede ignorarse

8.       La selección natural no afecta al gen que estamos considerando.

Estos supuestos, en conjunto, constituyen el modelo de Hardy-Weinberg desde que G.H. Hardy (1908) y W. Weinberg (1908), partiendo de estas condiciones simplificadas, llegaron a establecer una ley que relaciona las frecuencias génicas y genotípicas en una población, demostrando que las leyes de Mendel aplicadas a la dinámica de las poblaciones no sólo no eliminan la variabilidad natural sino que la mantienen en unas determinadas condiciones. El sentido de las premisas del modelo era, precisamente, llegar a entender qué efecto tiene la reproducción sexual, como proceso normal de transmisión hereditaria, sobre la variación genética de una población. Una vez que sepamos cómo se comportan los genes mendelianos en poblaciones ideales, estaremos en situación de estudiar su dinámica en poblaciones reales; podremos llegar a entender cómo afectan los distintos procesos implicados en el cambio evolutivo a la composición genética de una población.

Un locus autosómico con dos alelos

Cuando analizamos la transmisión hereditaria en esta población ideal de organismos diploides que se reproducen sexualmente es necesario distinguir tres niveles en el proceso. El primer nivel, lo constituyen los adultos de la generación parental (organismos diploides, 2n). El segundo nivel, lo constituyen los gametos (haploides, n), que son producidos por estos individuos a través de un proceso de meiosis. Y, el tercer nivel, lo constituyen los cigotos, donde la constitución genética diploide se restituye a través de la unión de gametos ocurrida durante la fecundación. Estos cigotos crecen y se desarrollan para convertirse en la siguiente generación de adultos. A nivel poblacional, lo que nos interesa es seguirle la pista a los genes mendelianos a través de las generaciones. Deseamos saber si un determinado alelo o genotipo aumentará o disminuirá de frecuencia a través del tiempo y porqué.

Vamos a considerar un locus A con dos alelos, A1 y A2, a los que vamos a rastrear a través de una vuelta completa del ciclo de vida (adultos – gametos – adultos), desde una generación a la siguiente. Comenzaremos este rastreo por la población de adultos en la generación parental. Puesto que se trata de organismos diploides, cada locus autosómico va a estar representado por dos alelos y, por tanto, habrá tres genotipos posibles en la población: A1A1,  A1A2, y A2A2, los cuales, se encontrarán con una determinada frecuencia genotípica, que podrá ser la que sea, y que denominaremos P, H y Q, respectivamente. A partir de estas frecuencias genotípicas, como ya hemos visto, podemos calcular las frecuencias génicas:

p + q = 1

El siguiente paso es analizar la producción de gametos en esta población y, por tanto, la composición de su acervo génico. Los adultos producen óvulos y espermatozoides por un proceso que denominamos meiosis. De acuerdo con las leyes mendelianas de segregación, cada gameto recibe un solo alelo para el locus A. Puesto que en el modelo hemos planteado que no hay selección, cada individuo contribuye por igual al acervo génico, y cada genotipo en función de su frecuencia en la población. Los individuos de genotipo A1A1 producen sólo gametos A1, los individuos de genotipo A2A2 producen sólo gametos A2, mientras que la mitad de los gametos producidos por individuos de genotipo A1A2 serán portadores del alelo A1 y la otra mitad portadores del alelo A2. Por tanto, el acervo génico de la población contendrá gametos A1 y gametos A2, en la misma proporción en que dichos alelos se encuentran en la población. Habrá, una proporción “p” (p = P + ½ H) de gametos portadores del alelo A1  y una proporción “q” (q = Q + ½ H) de gametos portadores del alelo A2 en el acervo.

En el modelo, hemos planteado que el apareamiento en la población es aleatorio, lo cual, es equivalente a suponer una unión azarosa de los gametos. Por tanto, el siguiente paso será dejar que los gametos del acervo génico se combinen de forma aleatoria para producir los cigotos de la siguiente generación. El cuadro de Punnett que se muestra a continuación proporciona una forma sistemática de establecer todas las posibles combinaciones de gametos, y la probabilidad con que se da cada una de ellas.

gametos masculinos (frecuencia)

A1 (p)

A2 (q)

gametos femeninos (frecuencia)

A1 (p)

A1A1 (p2)

A1A2 (pq)

A2 (q)

A1A2 (pq)

A2A2 (q2)

                Por tanto, el apareamiento aleatorio en la población produce cigotos en las siguientes proporciones:

A1A1 A1A2 A2A2
p2 2pq q2

p2 + 2pq + q2 = 1

Como podemos ver:

 (p + q)2 = p2 + 2pq + q2 = 1

            Esto ocurre siempre y cuando los apareamientos sean al azar.

Si los diferentes genotipos filiales sobreviven con igual probabilidad hasta la edad adulta, cuando llegan a ser padres, sus frecuencias serán iguales a las anteriores: p2, 2pq y q2. Ahora, podemos calcular las frecuencias génicas de la descendencia adulta, que designaremos como p1 (frecuencia del alelo A1) y p2 (frecuencia del alelo A2):

p1 = p2 + ½ 2pq = p2 + pq = p (p + q) = p

 q1 = q2 + ½ 2pq = q2 + pq = q (q + p) = q

que son las mismas de la generación parental.

Como podemos ver:

Como hemos visto, una consecuencia importante del principio de Hardy-Weinberg es que con independencia de cual haya podido ser la historia pasada de una población, basta una sola generación de apareamiento aleatorio para alcanzar las frecuencias genotípicas de equilibrio Hardy-Weinberg. Por ejemplo, si se establece una población con 3000 individuos A1A1 y 1000 individuos A2A2, estando ambos genotipos igualmente representados por ambos sexos, p = 0.75 y q = 0.25, una sola generación de apareamiento aleatorio daría origen a proporciones genotípicas de equilibrio: 0.5625 A1A1, 0.3750 A1A2, y 0.0625 A2A2. El mismo resultado se obtendría partiendo de cualquier mezcla de individuos en que p = 0.75 y q = 0.25, con independencia de cuales hayan sido las frecuencias genotípicas de partida, de lo alejadas que éstas se encontraran de la condición de equilibrio y del tiempo que se hubiera mantenido la situación de desequilibrio inicial.

La figura 1 muestra la relación entre las frecuencias génicas y genotípicas en una población en equilibrio Hardy-Weinberg. Las gráficas de las frecuencias genotípicas nos permiten destacar dos aspectos importantes. Primero, la frecuencia de heterocigotos no puede ser mayor del 50% (siempre y cuando el locus presente solo dos alelos), y su máximo ocurre cuando las frecuencias génicas son p = q = 0.5. Segundo, cuando la frecuencia génica de un alelo es baja, el alelo raro se presenta predominantemente en heterocigosis y hay muy pocos homocigotos. Esto tiene importantes consecuencias en la efectividad de la selección.

Figura 1.- Relación entre las frecuencias genotípicas y génicas para dos alelos en una población en equilibrio Hardy-Weinberg.

Alelismo múltiple

            Si este análisis, que hasta ahora planteado para el caso de un locus con dos alelos, lo generalizamos al caso más frecuente de una población con muchos alelos para un locus, obtenemos un resultado similar.

            Imaginemos un determinado locus con varios alelos, que podemos llamar Ai, Aj, Ak, etc. Podemos representar las frecuencias de estos alelos en el acervo génico con las variables pi, pj, pk, etc. La formación de un cigoto con genotipo AiAi requiere la unión de un óvulo Ai con un espermatozoide Ai. Por tanto, la frecuencia en el equilibrio de cualquier genotipo homocigoto AiAi es pi2. La formación de un cigoto con genotipo AiAj requiere la unión de un óvulo Ai con un espermatozoide Aj, o un óvulo Aj con un espermatozoide Ai. Por tanto, la frecuencia en el equilibrio de cualquier genotipo heterocigoto AiAj es 2pipj.

            Por ejemplo, si hubiera tres alelos, A1, A2 y A3, con frecuencias p1, p2 y p3, tal que p1 + p2 + p3 = 1, las frecuencias genotípicas de equilibrio vendrían dadas por (p1 + p2 + p3)2 = p12 + p22 + p32 + 2p1p2 + 2p1p3 + 2p2p3.

A1A1 A2A2 A3A3 A1A2 A1A3 A2A3
 p12  p22 p32 2p1p2 2p1p3 2p2p3

Como puedes tu mismo comprobar, las frecuencias génicas no cambian de generación en generación.

Prueba de equilibrio Hardy-Weinberg utilizando el test de chi-cuadrado

            En este apartado, vamos a utilizar los datos de Matthijs y colaboradores (1998) para ilustrar un método que permite determinar si las frecuencias genotípicas se desvían significativamente de las que cabría esperar en equilibrio Hardy-Weinberg. Estos investigadores analizaron una población de 54 individuos afectados del síndrome de Jaeken. El número de individuos encontrado con cada uno de los tres posibles genotipos fue el siguiente: 

Otro / Otro

Otro / R141H R141H / R141H

11

43 0

            A partir de estos números, vamos a calcular las frecuencias génicas de Otro y R141H, y determinar si las frecuencias genotípicas observadas corresponden con las que esperaríamos de acuerdo con el principio de equilibrio Hardy-Weinberg. El método consta de cinco pasos:

1.   Calcular las frecuencias génicas. La muestra de 54 individuos constituye una muestra de 108 alelos para el locus considerado. Los 22 alelos que portan los 11 individuos Otro/Otro son Otro, al igual que 43 de los alelos portados por los 43 individuos Otro/R141H. Por tanto, la frecuencia del alelo Otro es (22 + 43) / 108 = 0.6 y la frecuencia del alelo R141H es (43 + 0) / 108 = 0.4.

2.   Calcular las frecuencias genotípicas esperadas bajo la hipótesis de equilibrio Hardy-Weinberg, dadas las frecuencias génicas calculadas en el Paso 1. De acuerdo con el principio de equilibrio Hardy-Weinberg, si las frecuencias de dos alelos son “p” y “q”, entonces las frecuencias de los genotipos son p2, 2pq y q2. Por tanto, las frecuencias genotípicas esperadas en la población analizada son:

Otro / Otro Otro / R141H R141H / R141H

(0.6)2 = 0.36

2 (0.6) (0.4) = 0.48

(0.4)2 = 0.16

3.   Calcular el número esperado de individuos de cada genotipo bajo la hipótesis de equilibrio Hardy-Weinberg. Se calcula, simplemente, multiplicando la frecuencia esperada de cada genotipo por el número de individuos en la muestra, 54. Los valores esperados son:

Otro / Otro Otro / R141H R141H / R141H

( 0.36) (54) = 19.44

( 0.48) (54) = 25.92

( 0.16) (54) = 8.64

                Los números de individuos esperados son diferentes de los números de individuos realmente observados (11, 43 y 0). La muestra real contiene más heterocigotos y menos homocigotos de los esperados. ¿Cabe dentro de lo posible que esta diferencia entre lo esperado y lo observado pudiera surgir por azar?, o ¿es esta diferencia estadísticamente significativa?. Nuestra hipótesis nula es que la diferencia se debe exclusivamente al azar.

4.   Aplicar un test estadístico. Utilizaremos un test estadístico que fue desarrollado en 1900 por Karl Pearson. Se denomina el test de chi-cuadrado (c2). El chi-cuadrado se define como c2 = Σ [(observados – esperados)2 / esperados], donde el símbolo Σ indica el sumatorio para todas las clases consideradas. En nuestros datos hay tres clases: los tres genotipos. Por tanto, para nuestro conjunto de datos:

c2 = [(11 – 19.44)2 / 19.44] + [(43 – 25.92)2 / 25.92] + [(0 – 8.64)2 / 8.64] = 23.56

5.   Determinar si el valor del test estadístico es significativo. El chi-cuadrado se define de tal forma que el valor de chi-cuadrado aumenta al aumentar las diferencias entre valores observados y esperados. ¿Cuál es la probabilidad de que pudieramos obtener un valor de chi-cuadrado tan alto como 23.56 por azar?. La mayoría de los libros de estadística contienen una tabla que proporciona la respuesta.

Para utilizar esta tabla, es necesario calcular un número que se denomina los grados de libertad para el test estadístico. El número de grados de libertad para el chi-cuadrado es igual al número de clases (3 en nuestro caso, hay tres clases genotípicas), menos el número de parámetros independientes calculados a partir de los datos (1 en nuestro caso, porque se estimó “p” o “q” – una vez estimada la frecuencia de un alelo la del otro viene dada), menos el número de restricciones (1 en nuestro caso, porque el número de individuos esperados ha de ser igual al número de individuos observados). Por tanto, el número de grados de libertad en nuestro caso es 1. (Otra fórmula para calcular los grados de libertad en tests de chi-cuadrado para el equilibrio Hardy-Weinberg es: Número de clases – Número de alelos).

De acuerdo con la tabla que aparece en cualquier libro de estadística, el valor crítico de chi-cuadrado para un grado de libertad y P = 0.05 es 3.841. Esto quiere decir que existe un 5% de probabilidad bajo la hipótesis nula de obtener un c2 ³ 3.841. La probabilidad de obtener, bajo la hipótesis nula, un c2 ³ 23.56 es, por tanto, considerablemente menor del 5%. Por tanto, rechazamos la hipótesis nula, y consideramos que nuestro valor de chi-cuadrado es estadísticamente significativo a un valor de P < 0.05. (De hecho, en este caso P < 0.00001).

El test de chi-cuadrado realizado nos dice, por tanto, que la población analizada no se encuentra en equilibrio para este locus. Esto indica que uno o más de los supuestos del modelo de Hardy-Weinberg no se cumplen. Ahora bien, por si solo, no permite determinar cual de los supuestos se ha violado, o como. Por otra parte, en ningún caso, esta conclusión se puede extrapolar a otros loci, que podrán estar o no en equilibrio y para saberlo habrá que realizar el análisis estadístico oportuno de cada locus por separado.

Estimación de frecuencias génicas

            Vamos a considerar un locus A, con dos alelos, e ilustrar la estimación de las frecuencias génicas en dos situaciones:

1.       SIN DOMINANCIA

El locus A, presenta dos alelos codominantes, A1 y A2. En este caso, seremos capaces de distinguir fenotípicamente los tres genotipos posibles en la población: A1A1, A1A2, y A2A2. Si analizamos una muestra de N individuos, y encontramos que las frecuencias de estos tres genotipos en la muestra son P, H, y Q, respectivamente, las frecuencias del alelo A1 (p) y del alelo A2 (q) se calculan como ya hemos visto: p = P + ½ H; q = Q + ½ H; p + q = 1.

 Por el hecho de que estas frecuencias se estiman a partir de una muestra, y no del análisis de la totalidad de individuos de la población, la estima tiene un error (equivalente al error de un porcentaje) que se calcula a partir de la varianza de las frecuencias génicas:

 Vq = q (1 – q) / 2N

siendo el error ± 2 s (y s = Ö Vq). Este error nos está indicando que si nosotros tomáramos muchas muestras de N individuos en una población, y estimaramos las frecuencias génicas en cada una de ellas, la frecuencia del alelo A2 variaría dentro del rango q ± 2 s en las distintas muestras, simplemente, debido a error de muestreo – a haber analizado una muestra de N individuos (y, por tanto, de 2N genes) y no la totalidad de individuos (y de genes) de la población.

2.       CON DOMINANCIA

            Consideremos ahora que el locus A presenta dos alelos, A y a, de forma que A es dominante sobre a (alelo recesivo, que sólo se expresa en homocigosis). Cuando existe dominancia nos encontramos con un problema a la hora de estimar las frecuencias génicas. No hay una correspondencia entre clases fenotípicas y clases genotípicas. Distinguimos entre individuos de fenotipo dominante e individuos de fenotipo recesivo, pero dentro de los individuos de fenotipo dominante no podemos distinguir entre individuos de genotipo AA e individuos de genotipo Aa. Por tanto, no podemos estimar las frecuencias génicas como hemos hecho hasta ahora puesto que desconocemos la frecuencia de homocigotos AA y heterocigotos Aa. Lo único que conocemos a nivel genotípico, es la frecuencia de individuos homocigotos aa.

El modelo de Hardy-Weinberg proporciona una forma de salir de este atolladero. Ofrece una hipótesis de partida para estimar las frecuencias génicas cuando existe dominancia, asumiendo que existe equilibrio para el locus considerado en la población analizada. Si denominamos “p” a la frecuencia del alelo dominante A, y “q” a la frecuencia del alelo recesivo a, la frecuencia esperada de homocigotos recesivos aa en equilibrio será q2. Si asumimos que, efectivamente, la población está en equilibrio Hardy-Weinberg para este locus, esta frecuencia genotípica esperada (q2) debería ser igual a la frecuencia genotípica observada (Q), dato que conocemos puesto que se corresponde con la frecuencia de individuos de fenotipo recesivo. Por tanto, podemos estimar p y q como:

q = Ö Q, p = 1 – q.

Sin embargo, al estimar las frecuencias génicas de esta manera, estamos cometiendo un error añadido al ignorar los alelos a presentes en heterocigotos Aa. La varianza de frecuencias génicas en este caso viene dada por Vq = (1 – Q) / 4N, siendo el error ± 2 s (y s = Ö Vq). Este error nos está indicando que si nosotros tomáramos muchas muestras de N individuos en una población, y estimáramos las frecuencias génicas en cada una de ellas, la frecuencia del alelo a variaría dentro del rango q ± 2s en las distintas muestras, debido, por un lado, a error de muestreo – a haber analizado una muestra de N individuos (y, por tanto, de 2N genes) y no la totalidad de individuos (y de genes) de la población – y, por otro, a haber ignorado la presencia de alelos a en individuos heterocigotos Aa. Por tanto, el error de la estima será mayor en este caso.

Evidentemente, si para estimar las frecuencias génicas hemos de suponer equilibrio Hardy-Weinberg, resulta TOTALMENTE ABSURDO plantear a posteriori una prueba de equilibrio utilizando el test de c2.

Cuestiones para resolver