La matemática detrás del árbol de la vida: ¿puede la estadística probar la evolución?

Concepto de genética.
Concepto de genética.TanyaJoy

¿Cuán emparentados estamos con las ratas o los canguros? En la década de 1980, David Penny desafió el ámbito científico al revelar cómo la convergencia de árboles evolutivos construidos a partir de datos moleculares proporciona evidencia estadística de la evolución, marcando un hito en la comprensión de nuestro linaje compartido.

A principios de los años 80, cuando la palabra genómica aún no existía, un grupo de científicos encabezado por David Penny se hizo una pregunta incómoda para la época: si la evolución es real, ¿debería ser posible reconstruir el mismo “árbol de la vida” una y otra vez usando moléculas diferentes? Y, si eso ocurre, ¿cuán improbable sería atribuirlo al azar?

La respuesta inauguró una forma de pensar la evolución que hoy parece obvia, pero que entonces fue disruptiva: la prueba no estaba en los huesos, sino en la estadística que emerge de las moléculas.

El experimento que probó que la evolución deja huellas medibles

En el libro “Evolución: El mayor espectáculo sobre la Tierra”, el biólogo Richard Dawkins usa en un capítulo el experimento conceptual del biólogo David Penny para mostrar cómo funciona realmente un árbol de la vida.

La idea central es: si comparás organismos muy distintos a nivel genético, las diferencias acumuladas permiten reconstruir qué especies están más emparentadas, aunque a simple vista no lo parezca.

Todos los beneficios, en un solo lugar Descubrí donde te conviene comprar hoy

Penny toma un grupo de 11 especies muy diversas y las compara usando secuencias de ADN o proteínas. Luego aplica métodos matemáticos para encontrar el árbol evolutivo que mejor explica todas esas similitudes y diferencias.

El resultado es que, incluso con organismos extremadamente distintos, las herramientas de la biología evolutiva reconstruyen un árbol coherente y lógico, que coincide con lo que se espera según la teoría de la evolución.

Dawkins usa este ejemplo para demostrar dos cosas:

  1. La evolución deja una huella cuantificable, que aparece tanto si mirás huesos como si mirás genes.
  2. La evidencia converge: distintas técnicas arrojan árboles muy parecidos.

Es una defensa elegante de que la evolución no es una opinión, sino un hecho reconstruible mediante datos.

La combinatoria que hace imposible repetir el azar

Construir un árbol evolutivo es, ante todo, un problema combinatorio. Al conectar especies en un diagrama de parentesco, el número de posibles árboles crece vertiginosamente con cada taxón agregado.

Para 11 especies, la cantidad de árboles posibles con una raíz supera los 650 millones; si se consideran matices adicionales o una especie más, el espacio de posibilidades salta a decenas de miles de millones. En términos prácticos, es un universo tan vasto que dos conjuntos de datos independientes “tropezando” con el mismo árbol por azar se vuelve virtualmente imposible.

Esto fue clave en el diseño de Penny y sus colegas. Si distintos genes—cada uno con su propia historia de mutaciones—producen el mismo árbol entre cientos o miles de millones de alternativas, la coincidencia deja de ser creencia o intuición y se convierte en evidencia estadística.

Los experimentos de Penny: la evolución, vista en moléculas

En 1982, Penny y colaboradores compararon árboles inferidos a partir de varias proteínas para el mismo conjunto de especies.

El planteo era deliberadamente duro: elegir datos independientes y ver si, aplicando métodos de reconstrucción filogenética, convergían en la misma topología. No se trataba de “forzar” un árbol, sino de dejar que los datos hablaran.

Pese a las limitaciones computacionales y de secuenciación de la época, los árboles derivados de proteínas distintas coincidían con una frecuencia que no podía explicarse por simple azar.

Con un telón de fondo combinatorio de cientos de millones de posibles configuraciones (y más allá al ampliar el conjunto), la congruencia entre genes actuó como una firma estadística de la historia evolutiva común.

En retrospectiva, ese enfoque anticipó la era genómica. Décadas después, con datos de miles de genes y genomas completos, la idea se generalizó: cuando múltiples loci independientes apuntan al mismo árbol entre millones de alternativas, la explicación parsimoniosa no es la casualidad, sino el linaje compartido.

La estadística como evidencia evolutiva

El poder de esta lógica no reside en un único árbol perfecto, sino en la replicación. Cada gen es un experimento independiente. Si cinco, diez o cien genes, analizados con métodos distintos, reconstruyen esencialmente la misma estructura de parentescos, la probabilidad de que todos lo hagan por azar se desploma.

En un espacio con cientos o miles de millones de árboles posibles para un conjunto de 11–12 especies, la repetición consistente del mismo resultado es, estadísticamente, una consecuencia inevitable de la evolución, no una premisa filosófica.

Esa es la diferencia crucial: la evolución deja de ser un punto de vista para convertirse en una predicción cuantitativa. Los datos convergen más allá de los detalles del método porque comparten un mismo proceso histórico.

Por qué no era un truco, sino el inicio de un estándar

El verdadero legado de Penny y colegas no fue una técnica específica, sino un criterio de prueba: la coherencia reproducible en un espacio combinatorio descomunal.

Ese estándar—exigir que múltiples líneas moleculares, bajo modelos explícitos, converjan—es el que hoy sostiene los grandes consensos del árbol de la vida, desde la relación entre humanos y otros primates hasta la arquitectura profunda de los dominios celulares.

En un universo con cientos o miles de millones de árboles posibles incluso para una docena de especies, la misma historia repitiéndose una y otra vez no es un milagro; es estadística.