Genealogical properties of spatial models in Population Genetics

Loading...
Thumbnail Image
Date
2023-09
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Hannover : Technische Informationsbibliothek
Link to publishers version
Abstract

At the interface between Phylo- and Population Genetics, and recently heavily inspired by Epidemonology, the discipline of Phylogeography comprises modelling techniques from classical theoretical biology and combines them with a spatial (2D or 3D) aspect, with the purpose of utilizing geographical information in the analysis to understand the evolutionary history of a biological system or aspects of virology such as directionality and seasonality in pandemic outbreaks [1, 2, 3, 4]. An prime example of this are datasets that take into account the sampling locations of its components (geo-referenced genomic data). In this project, we have focused on the model called "spatial Lambda-Fleming-Viot process" ( V [5, 6]) and analzed its statistical properties forward in time as well as in the ancestral (dual) process, with results that may be used for parameter inference. Of particlar interest was the spatial variance, denoted , a parameter controlling the speed at which genetic information is spread across space and therefore an analog of the reproduction number (R0) used in epidemonology e.g. to assess the infectiousness of differing viral strains. We explored the relation of this parameter to the time to coalescence between lineage pairs in this model and described methods of estimating it from sampled data under different circumstances. We have furthermore investigated similarities and differences between this model and classical models in Population Genetics, particularly Birth-Death processes, which are heavily used for all kinds of biological inference problems, but do not by themselves feature a spatial component. We compared the Vto a variant of the Birth-Death process where the location of a live individual changes over the course of its lifetime according to a Brownian motion. This process is not as easily viewed backward in time as the V, but the genalogical process is accessible by Markov-Chain Monte Carlosimulation, as the likelihoods of ancestral positions and branch lengths are easily calculated, making this model easily applicable to data. Our analysis highlights the analogy between the two processes forward in time as well as backward in time; on the other hand, we also observed a divergent behavior of the two models when no prior on the phylogenetic time scale was assumed. Lastly, this project has given rise to a study of combinatorial properties of tree shapes relevant to the V, the Birth-Death and other biological processes. In particular, we were able to identify the combinatorial class genealogical trees generated from these processes belong to and verify a conjecture regarding their enumeration. Preliminary versions of software tools for the aforementioned inference have also been provided.


An der Schnittstelle zwischen Phylo- und Populationsgenetik und neuerdings stark von der Epidemonologie inspiriert, umfasst die Disziplin der Phylogeographie Modellierungstechniken aus der klassischen theoretischen Biologie und kombiniert sie mit einem räumlichen (2D- oder 3D-) Aspekt mit dem Ziel, geografische Informationen in der Analyse zu nutzen, um die Evolutionsgeschichte eines biologischen Systems oder Aspekte der Virologie wie Richtungsabhängigkeit und Saisonalität bei Pandemieausbrüchen zu verstehen. Ein hervorragendes Beispiel hierfür sind Datensätze, die die Entnahmestellen ihrer Komponenten berücksichtigen (georeferenzierte genomische Daten). In diesem Projekt konzentrierten wir uns auf das Modell des "spatialen Lambda-Fleming-Viot-Prozesses" (ΛV) und analysierten seine statistischen Eigenschaften sowohl in der Zeit vorwärts als auch im (dualen) Ahnenprozess, mit Ergebnissen, die für die Ableitung von Parametern verwendet werden können. Von besonderem Interesse war die räumliche Varianz, bezeichnet mit θ, ein Parameter, der die Geschwindigkeit steuert, mit der sich die genetische Information im Raum ausbreitet, und somit ein Analogon der Reproduktionszahl (R0), die in der Epidemonologie z. B. zur Beurteilung der Infektiosität verschiedener Virusstämme verwendet wird. Wir untersuchten die Beziehung zwischen diesem Parameter und der Zeit bis zur Koaleszenz zwischen Abstammungslinien in diesem Modell und beschrieben Methoden zur Schätzung dieses Parameters anhand von Stichprobendaten unter verschiedenen Umständen. Darüber hinaus wurden Ähnlichkeiten und Unterschiede zwischen diesem Modell und klassischen Modellen in der Populationsgenetik herausgearbeitet, insbesondere zu Birth-Death-Prozessen, die häuf g für alle Arten von biologischen Inferenzproblemen verwendet werden, aber an sich keine räumliche Komponente aufweisen. Der ΛV wurde mit einer Variante des Birth-Death-Prozesses verglichen, bei welcher der Standort eines lebenden Individuums im Laufe seines Lebens einer Brownschen Bewegung folgt. Dieser Prozess lässt sich nicht so leicht in der Zeit zurückverfolgen wie der ΛV, aber der genalogische Prozess kann durchMarkov-ChainMonte Carlo-Simulation approximiert werden, da dieWahrscheinlichkeiten für die Positionen der Vorfahren und die Länge der Verzweigungen leicht berechnet werden können, so dass dieses Modell leicht auf Daten anwendbar ist. Unsere Analyse unterstreicht die Analogie zwischen den beiden Prozessen sowohl vorwärts als auch rückwärts in der Zeit; andererseits beobachteten wir auch divergente Verhaltensweisen der beiden Modelle, wenn kein Prior auf der phylogenetischen Zeitskala angenommen wurde. Zuletzt wurden im Rahmen dieses Projekts kombinatorische Eigenschaften von genealogischen Bäumen untersucht, die für den ΛV, die Birth-Death- und andere biologische Prozesse relevant sind. Insbesondere waren wir in der Lage, die kombinatorische Klasse genealogischer Bäume, die aus diesen Prozessen hervorgehen, zu identif zieren und eine Vermutung bezüglich ihrer Aufzählung zu verif zieren. Vorläuf ge Versionen von Software-Tools für die oben erwähnte Inferenz wurden ebenfalls zur Verfügung gestellt.

Description
Keywords
Citation
Wirtz, J. (2023). Genealogical properties of spatial models in Population Genetics. Hannover : Technische Informationsbibliothek.
Collections
License
CC BY 4.0