Páginas

Diversidad genómica y distribución global de Saccharomyces eubayanus, el ancestro salvaje de las levaduras híbridas de cerveza lager

Texto traducido automáticamente por Google Translate
Quinn K. LangdonDavid PerisJuan I. EizaguirreDana A. OpulenteKelly V. BuhKayla SylvesterMartin JarzynaMaría E. RodríguezChristian A. LopesDiego Libkind

Resumen

S. eubayanus , el padre salvaje y tolerante al frío de las levaduras híbridas que elaboran cerveza lager, tiene una historia natural compleja y poco estudiada. La exploración de esta diversidad se puede utilizar tanto para desarrollar nuevas aplicaciones de elaboración de cerveza como para iluminar nuestra comprensión de la dinámica de la evolución de la levadura en la naturaleza. Aquí, integramos la secuencia del genoma completo y los datos fenotípicos de 200   cepas de S. eubayanus , la colección más grande hasta la fecha. S. eubayanus tiene una estructura de población multicapa, que consta de dos poblaciones principales que se estructuran en seis subpoblaciones. Cuatro de estas subpoblaciones se encuentran exclusivamente en la región patagónica de América del Sur; uno se encuentra predominantemente en la Patagonia y escasamente en Oceanía y América del Norte; y uno es específico de la ecozona Holarctic. S. eubayanus  es más abundante y genéticamente diverso en la Patagonia, donde algunos lugares albergan más diversidad genética que la que se encuentra fuera de América del Sur. Todas las subpoblaciones menos una muestran aislamiento por distancia, y el flujo de genes entre las subpoblaciones es bajo. Sin embargo, hay fuertes señales de cruces antiguos y recientes, que incluyen dos linajes mezclados, uno que simpatiza y otro que está aislado principalmente de sus poblaciones parentales. A pesar de La extensa diversidad genética de S. eubayanus , tiene relativamente poca diversidad fenotípica, y todas las subpoblaciones se desempeñaron de manera similar en la mayoría de las condiciones analizadas. Utilizando nuestros extensos datos biogeográficos, construimos un modelo robusto que predijo todas las regiones del mundo conocidas y un puñado de ellas que son climáticamente adecuadas para  S. eubayanus , incluida Europa. Concluimos que esta especie industrialmente relevante tiene una rica diversidad silvestre con muchos factores que contribuyen a su compleja distribución y biología.

Introducción

En la genómica de la población microbiana, la interacción de la asociación humana y la variación natural todavía es poco conocida. El género  Saccharomyces  es un modelo óptimo para abordar estas preguntas para los microbios eucariotas, ya que contiene especies parcialmente asociadas a humanos (es decir,  Saccharomyces cerevisiae ) y principalmente especies silvestres (por ejemplo,  Saccharomyces paradoxus) . Estos dos ejemplos también ilustran la complejidad de estudiar la genómica de la población de levaduras. Gran parte de la  estructura de la población de  S. cerevisiae está mezclada, y varios linajes muestran firmas de domesticación ( Liti et al. 2009 ;  Schacherer et al. 2009 ;  Gallone et al. 2016 ;  Gonçalves et al. 2016) Por el contrario,  S. paradoxus se  encuentra casi exclusivamente en la naturaleza y tiene una estructura de población que se correlaciona con la geografía ( Leducq et al. 2014 ;  Eberlein et al. 2019 ). Los aislados puros de su pariente más distante  Saccharomyces eubayanus  solo se han aislado de ambientes salvajes; Sin embargo, las hibridaciones entre  S. cerevisiae  y  S. eubayanus  fueron innovaciones clave que permitieron la fermentación en frío y la elaboración de cerveza lager ( Libkind et al. 2011 ;  Gibson y Liti 2015 ;  Hittinger et al.2018 ;  Baker et al.2019 ). Otros híbridos con contribuciones de  S. eubayanus se han aislado de entornos industriales ( Almeida et al. 2014 ;  Nguyen y Boekhout 2017 ), lo que indica que esta especie ha estado desempeñando un papel en la conformación de muchos productos fermentados. Esta asociación con ambientes tanto naturales como domesticados hace de  S. eubayanus  un excelente modelo donde se puede investigar tanto la diversidad salvaje como la domesticación.
Desde el descubrimiento de  S. eubayanus  en la Patagonia ( Libkind et al. 2011 ), esta especie ha recibido mucha atención, tanto para aplicaciones de elaboración de cerveza como para comprender la evolución, ecología, genómica de poblaciones del género  Saccharomyces  ( Sampaio 2018 ). En los años posteriores a su descubrimiento, se han encontrado muchos nuevos aislamientos distribuidos globalmente ( Bing et al. 2014 ;  Peris et al. 2014 ;  Rodríguez et al. 2014 ;  Gayevskiy y Goddard 2016 ;  Peris et al.2016 ;  Eizaguirre et al.2018 ) Investigaciones previas han sugerido que  S. eubayanus es más abundante y diversa en la región patagónica de América del Sur, donde hay dos poblaciones principales (Patagonia A / Población A / PA y Patagonia B / Población B / PB) que los datos recientes de enfoque múltiple sugeridos se dividen en cinco subpoblaciones (PA- 1, PA-2, PB-1, PB-2 y PB-3) ( Eizaguirre et al.2018 ). Hay dos linajes de divergencia temprana, China occidental y Sichuan, que se identificaron a través de datos multilocus ( Bing et al. 2014 ) y cuyas divergencias de secuencia con respecto a otras cepas de  S. eubayanus  son casi las de los límites de especies actualmente reconocidos ( Peris et al. 2016 ;  Sampaio y Gonçalves 2017 ;  Naseeb et al.2018) Se ha encontrado un linaje único mezclado solo en América del Norte, que tiene contribuciones aproximadamente iguales de PA y PB ( Peris et al. 2014 ,  2016 ). Otros aislamientos de fuera de la Patagonia pertenecen a PB, ya sea la subpoblación de PB-1 que también se encuentra en la Patagonia ( Gayevskiy y Goddard 2016 ;  Peris et al.2016 ), o una subpoblación específica de Holarctic que incluye aislamientos del Tíbet y de Carolina del Norte, Estados Unidos ( Bing et al. 2014 ;  Peris et al. 2016 ). Esta subpoblación holártica incluye los parientes silvestres más cercanos conocidos de los   subgenomas de S. eubayanus de levaduras cerveceras ( Bing et al. 2014 ;  Peris et al. 2016).
Para explorar la distribución geográfica, el nicho ecológico y la diversidad genómica de esta especie industrialmente relevante, aquí presentamos un análisis de datos de secuenciación del genoma completo para 200   cepas de S. eubayanus . Este conjunto de datos confirma la estructura de la población propuesta previamente ( Peris et al. 2014,  2016 ;  Eizaguirre et al. 2018 ) y extiende el análisis para explorar completamente la diversidad genómica. Aunque  S. eubayanus  es genéticamente diverso y está distribuido globalmente, no existen grandes diferencias fenotípicas entre las subpoblaciones. Este conjunto de datos genómicos incluye evidencia de flujo de genes y mezcla en simpatría, así como mezcla en parapatría o alopatría. Mientras  S. eubayanus tiene una estructura de población bien diferenciada, el aislamiento por distancia ocurre dentro de subpoblaciones que se encuentran globalmente, así como dentro de subpoblaciones restringidas a un puñado de ubicaciones. Gran parte de la diversidad genética se limita al norte de la Patagonia, pero el modelo sugiere que hay más áreas geográficas que son climáticamente adecuadas para esta especie, incluida Europa. S. eubayanus mantiene la diversidad genética en varias dimensiones, incluidas múltiples poblaciones simpátricas de alta diversidad y un linaje invasivo generalizado de baja diversidad. La diversidad y dispersión de esta especie microbiana eucariota refleja las observaciones en plantas y animales, incluidos los humanos, lo que muestra cómo las fuerzas biogeográficas y evolutivas se pueden compartir a través de tamaños de organismos, grandes y pequeños.

Resultados

 Estructura y ecología de la población mundial y regional de  S. eubayanus

Para expandir en datos existentes ( Libkind et al 2011. ;  Bing et al 2014. ;  Peris et al 2014. ;  Rodríguez et al 2014. ;  Gayevskiy y Goddard 2016 ;  Peris et al 2016. ;  . Eizaguirre et al 2018 ), la secuencia los genomas de 174 cepas adicionales de  S. eubayanus , lo que lleva nuestra encuesta a 200   genomas de S. eubayanus . Esta gran colección proporciona el conjunto de datos más completo hasta la fecha para  S. eubayanus . Observamos que el conjunto de datos no contiene cepas de China occidental o Sichuan ( Bing et al. 2014), que no estaban disponibles para el estudio y pueden constituir una especie o subespecie distinta. Estas cepas se distribuyeron globalmente ( Figura 1A ), pero la mayoría de nuestras cepas eran de América del Sur (172 en total, 155 recién secuenciadas aquí). El siguiente continente más abundante fue América del Norte con 26 cepas (19 nuevas en esta publicación). También analizamos los datos de la secuencia del genoma completo para la cepa única de Nueva Zelanda ( Gayevskiy y Goddard 2016 ) y el aislado tibetano único con los datos disponibles de la secuencia del genoma completo ( Bing et al. 2014 ;  Brouwers et al. 2019 ). Los sitios de recolección en América del Sur abarcan desde el norte de la Patagonia hasta Tierra del Fuego ( Figura 1B), mientras que los aislamientos de América del Norte se han encontrado escasamente en todo el continente, incluida la provincia canadiense de Nuevo Brunswick y los estados estadounidenses de Washington, Wisconsin, Carolina del Norte y Carolina del Sur ( Figura 1C ).

Distribución de S. eubayanus y estructura de la población. S. eubayanus tiene una distribución global y dos poblaciones principales con seis subpoblaciones. (A) Ubicaciones de aislamiento de cepas de S. eubayanus incluidas en el conjunto de datos. Para la visibilidad, el tamaño del círculo no se escala por el número de cepas. La abundancia de la subpoblación se muestra en gráficos circulares. Los sitios de muestreo patagónicos se han colapsado en dos ubicaciones para mayor claridad. Detalles de los sitios y subpoblaciones encontrados en América del Sur (B) y América del Norte (C) con un tamaño de círculo escalado por el número de cepas. (D) PCA de genoma completo de cepas de S. eubayanus y cinco híbridos con grandes contribuciones de S. eubayanus. (E) PCA de solo PA. (F) PCA de solo PB y subgenomas híbridos de S. eubayanus. Las leyendas de color en A y D se aplican a esta y todas las demás figuras.
Para determinar la estructura de la población, tomamos varios enfoques, incluido el Análisis de componentes principales (PCA) ( Jombart 2008 ), redes filogenómicas ( Huson y Bryant 2006 ) y análisis similares a ESTRUCTURA ( Lawson et al. 2012 ;  Raj et al. 2014 ). Todos los métodos mostraron que  S. eubayanus  tiene dos grandes poblaciones que se pueden subdividir en un total de seis subpoblaciones no mezcladas y un abundante linaje mezclado norteamericano ( Figura 1D  y  Figura S1 ). Anteriormente describimos las dos poblaciones principales, PA y PB-Holarctic ( Peris et al. 2014 ,  2016), así como las subpoblaciones PA-1, PA-2, PB-1, PB-2, Holarctic y el linaje mezclado norteamericano ( Peris et al.2016 ). PB-3 había sido sugerido por datos multilocus ( Eizaguirre et al.2018 ), y nuestros nuevos análisis confirman esta subpoblación con datos completos de la secuencia del genoma. Todas las cepas aisladas de fuera de América del Sur pertenecían al linaje mezclado norteamericano descrito anteriormente (NoAm) o una de las dos subpoblaciones de PB, PB-1 u Holarctic. Este conjunto de datos incluyó nuevos aislados de PB-1 de los estados de Washington (yHRMV83) y Carolina del Norte (yHKB35). Inesperadamente, de este mismo sitio en Carolina del Norte, también obtuvimos nuevos aislamientos del linaje mezclado NoAm ( Figura 1C y Tabla S1), y obtuvimos nuevas cepas de NoAm adicionales en Carolina del Sur. Juntos, con las cepas de Carolina del Norte reportadas aquí y anteriormente ( Peris et al.2016 ), esta región cerca de las montañas Blue Ridge alberga tres subpoblaciones o linajes, PB-1, Holarctic y NoAm. También tuvimos éxito en volver a aislar el linaje NoAm del mismo sitio de Wisconsin, muestreando dos años después de lo que se informó por primera vez ( Peris et al. 2014 ) (Tabla S1), lo que indica que el linaje mezclado NoAm está establecido, no es efímero, en este lugar Además, encontramos una nueva cepa sudamericana que se mezcló entre PA (∼45%) y PB (∼55%) ( Figura 1D  "SoAm"). Esta distribución global y la estructura poblacional bien diferenciada de S. eubayanus  es similar a lo observado en  S. paradoxus  ( Leducq et al. 2014 ,  2016 ) y  Saccharomyces uvarum  ( Almeida et al. 2014 ).
S. eubayanus  se ha aislado de numerosos sustratos y hospedadores, y nuestro gran conjunto de datos nos brindó el poder de analizar la asociación del hospedador y sustrato por subpoblación. Encontramos que PA-2 se asoció con las semillas de  Araucaria araucana  (45.71% de los aislados, p-val = 6.11E-07, estadística F = 15.29). Curiosamente, aunque PB-1 fue la subpoblación aislada con mayor frecuencia (34% de los aislamientos), nunca se ha aislado de las  semillas de  A. araucana . En cambio, PB-1 se asoció con  Nothofagus antarctica  (52.31% de los aislamientos, p-val = 0.017, F-estadística = 3.10). PB-1 también fue la subpoblación más aislada de  Nothofagus dombeyi  (75% de los aislados de esta especie arbórea), que es un huésped común de  S. uvarumLibkind et al.2011 ;  Eizaguirre et al.2018 ). PB-2 se asoció positivamente con  Nothofagus pumilio  (36.59% de los aislamientos, p-val = 9.60 E-04, F-estadística = 6.59), que podría ser un factor ecológico que mantiene a PB-2 parcialmente aislado de sus subpoblaciones simpáticas, PA- 2 y PB-1 ( Figura 1C ). PB-3 se asoció con el parásito fúngico  Cyttaria darwinii  (14.29% de los aislamientos, p-val = 0.039, estadístico F = 25.34) y  Nothofagus betuloides (28.57% de los aislamientos, p-val = 5.02E-06, estadístico F = 60,35), que solo se encuentra en el sur de la Patagonia y es vicariante con  N. dombeyi, un anfitrión de PB-1. PB-3 se aisló con frecuencia en la Patagonia austral (49% de los aislamientos australes) ( Eizaguirre et al.2018 ), y su asociación con una especie de árbol distribuida en el sur podría desempeñar un papel en su rango geográfico y aislamiento genético de las subpoblaciones del norte. Ni  Nothofagus  ni  A. araucana  son nativos de América del Norte, y descubrimos que nuestros aislamientos de América del Norte provenían de múltiples huéspedes de plantas diversas, incluidos  Juniperus virginiana, Diospyros virginiana, Cedrus  sp. Y  Pinus  sp. (Tabla S1), así como de muestras de suelo y corteza. En la Patagonia,  S. eubayanus  ha sido aislado de exóticos   árboles Quercus (Eizaguirre y col. 2018 ), por lo que aunque  Nothofagus  y  A. araucana  son huéspedes comunes,  S. eubayanus  se puede encontrar en una variedad de huéspedes y sustratos. Estas diferencias observadas en el huésped y el sustrato podrían estar desempeñando un papel en el mantenimiento de su estructura de población, especialmente en las regiones simpáticas de la Patagonia.

Todas las subpoblaciones crecen a temperaturas de congelación y en diversas fuentes de carbono.

S. eubayanus  proviene de una amplia gama de entornos, por lo que probamos si había diferencias fenotípicas entre estas subpoblaciones. Medimos las tasas de crecimiento en varias fuentes de carbono y las respuestas al estrés para un gran subconjunto de estas cepas (190) y 26 cepas cerveceras ( Figura 2  y  Figura S2 ). Las cepas de elaboración de cerveza crecieron más rápido con maltotriosa que todas las subpoblaciones (p-val <0.05,  Figura 2A ), lo que es consistente con que este azúcar sea uno de los más abundantes en la producción de mosto pero de naturaleza rara ( Salema-Oom et al. 2005 ) . La subpoblación holártica creció más lentamente en glucosa y maltosa en comparación con todas las demás subpoblaciones (p-val <0.05,  Figura 2A, Tabla S2). En general, el linaje NoAm mezclado funcionó mejor que PB-1 (p-val = 0.038,  Figura 2A ), pero no hubo interacción con la fuente de carbono. Por lo tanto, la robustez del linaje mezclado en muchas condiciones podría desempeñar un papel en su éxito en sitios remotos de América del Norte donde nunca se han encontrado cepas puras de PA o PB.
Figura 2. Diferencias fenotípicas. (A) Mapa de calor de la media de la tasa de crecimiento máxima (cambio en OD / hora) (GR) en diferentes fuentes de carbono por subpoblación. Los colores más cálidos designan un crecimiento más rápido. (B) Mapa de calor del crecimiento log10 normalizado a diferentes temperaturas por subpoblación.
Dado que  la contribución de S. eubayanus a la adaptación en frío de las cepas híbridas está bien establecida ( Libkind et al.2011 ;  Gibson et al.2013 ;  Baker et al.2019 ), medimos el crecimiento a 0 ° C, 4 ° C, 10 ° C y 20 ° C. Todas las subpoblaciones crecieron a temperaturas tan bajas como 0 ° C ( Figura 2B  y  Figura S2 ), y todas las   subpoblaciones de S. eubayanus superaron a las levaduras cerveceras (p <0.05). Dentro de S. eubayanus puro , no hubo interacciones de temperatura por subpoblación, lo que indica que ninguna subpoblación es más criolerante que cualquier otra subpoblación. En resumen, descubrimos que todas las cepas que probamos crecieron de manera similar en muchos entornos, y a pesar de la gran cantidad de diversidad genotípica observada para esta especie, observamos mucha menos diversidad fenotípica ( Figura 2 ).

Las subpoblaciones están bien diferenciadas

Las estrategias de apareamiento y el ciclo de vida de  Saccharomyces , con el apareamiento intrínseco y el autodesplazamiento, a menudo conducen a individuos diploides homocigotos ( Hittinger 2013 ). Sin embargo, en  S. cerevisiae , muchas cepas industriales son altamente heterocigóticas ( Gallone et al.2016 ;  Gonçalves et al.2016 ;  Peter et al.2018 ). Aquí, analizamos la heterocigosidad del genoma completo en nuestra colección de 200 cepas y encontramos solo un individuo con más de 20,000 SNP heterocigotos ( Figura S3 ). Cuando escalonamos regiones altamente heterocigóticas de su genoma y analizamos las dos fases por separado, encontramos que ambas fases se agruparon dentro de PB-1 ( Figura S3C) Por lo tanto, aunque esta cepa es altamente heterocigótica, tiene contribuciones de una sola subpoblación.
Esta gran colección de cepas es un recurso poderoso para explorar la variación natural y la demografía de la población en un microbio salvaje, por lo que analizamos varias estadísticas genómicas de la población común en ventanas de 50 kbp en todo el genoma. Encontramos que la diversidad era similar entre las subpoblaciones ( Figura S4A ). También calculamos la D de Tajima y descubrimos que la media del genoma era cero o negativa para cada subpoblación ( Figura S4B ), lo que podría ser indicativo de expansiones de la población. En particular, la subpoblación más numerosa y generalizada, PB-1, tuvo la D de Tajima más negativa y consistente, lo que sugiere que una expansión de la población reciente es especialmente probable en este caso.
Para los linajes no mezclados, el F ST promedio de  todo el genoma fue consistentemente alto en todo el genoma ( Figura S4C ). En las comparaciones por pares de F ST,  PB-1 tuvo los valores más bajos de cualquier subpoblación ( Figura 3A ,  Figura S4D ). Estas comparaciones por pares también mostraron que, dentro de cada población, ha habido cierto flujo de genes entre las subpoblaciones, a pesar de que las subpoblaciones generalmente estaban bien diferenciadas. La descomposición del desequilibrio de enlace (LD) indicó una baja recombinación en estas subpoblaciones salvajes ( Figura 3B ), con variabilidad entre las subpoblaciones. Para la especie en su conjunto, el LD decayó a la mitad a aproximadamente 5 kbp, que es algo más alto que el 500bp - 3kbp observado en S. cerevisiae  ( Liti et al. 2009 ;  Schacherer et al. 2009 ;  Peter et al. 2018 ) y por debajo de los 9 kbp observados en  S. paradoxus  ( Liti et al. 2009 ), lo que indica que hay menos apareamiento, cruzamiento, y / o recombinación en esta especie salvaje que  S. cerevisiae  y más que en  S. paradoxus .

Figura 3. Parámetros genómicos de la población. (A) Red construida con valores FST por pares <0.8 entre cada subpoblación. Los valores FST se imprimen y corresponden al grosor de la línea, donde los valores más bajos son más gruesos. Los tamaños de los círculos corresponden a la diversidad genética. (B) Disminución de LD para cada subpoblación (colores) y las especies en su totalidad (negro).

Mezcla reciente y flujo de genes históricos entre poblaciones

Anteriormente informamos la existencia de 7 cepas de un linaje mezclado en Wisconsin, EE. UU. Y Nuevo Brunswick, Canadá ( Peris et al. 2014 ,  2016 ). Aquí, presentamos 14 aislamientos adicionales de este mismo linaje mezclado. Estos nuevos aislamientos provenían del mismo sitio en Wisconsin, así como de dos nuevas ubicaciones en Carolina del Norte y Carolina del Sur (Tabla S1). Sorprendentemente, las 21 cepas compartieron exactamente el mismo perfil de ascendencia de todo el genoma ( Figura 4A ), lo que indica que todas descendieron del mismo evento de cruzamiento entre las dos poblaciones principales de  S. eubayanus . Estas cepas mezcladas se diferenciaron por 571 SNP, que también delinearon estas cepas geográficamente ( Figura 4B ). Diversidad por pares y F STLas comparaciones entre los genomas sugieren que el progenitor PA provenía de la subpoblación PA-2 ( Figura 4C  y  Figura S5A ) y que el progenitor PB era de la subpoblación PB-1 ( Figura 4D  y  Figura S5A ).
Figura 4. Antepasados ​​genómicos de linajes mezclados NoAm y SoAm. (A) Para las 21 cepas mezcladas de NoAm, relación log2 de la divergencia mínima de secuencia de nucleótidos por pares PB-NoAm (dB-NoAm) y la divergencia mínima de secuencia de nucleótidos por pares PA-NoAm (dA-NoAm) en ventanas de 50 kbp. Los colores y log2 <0 o> 0 indican que parte del genoma está más estrechamente relacionado con PA o PB, respectivamente. (B) Red filogenética Neto-Vecina reconstruida con los 571 SNP que diferencian las cepas de NoAm. La barra de escala representa el número de sustituciones por sitio. Se anota la ubicación de la colección. (C) Divergencia de secuencia de nucleótidos por pares de la cepa NoAm yHKS210 en comparación con las cepas de las subpoblaciones de PA PA-1 y PA-2 en ventanas de 50 kbp. (D) Divergencia de secuencia de nucleótidos por pares de la cepa NoAm yHKS210 en comparación con las cepas del PB-1, PB-2 y subpoblaciones PB-3 de PB en ventanas de 50 kbp. (E) relación log2 de la divergencia de secuencia de nucleótidos por pares PB-SoAm mínima (dB-SoAm) y la divergencia de secuencia de nucleótidos por pares PA-SoAm mínima (dA-SoAm) en ventanas de 50 kbp. Los colores y log2 <0 o> 0 indican que parte del genoma está más estrechamente relacionado con PA o PB, respectivamente. (F) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones de PA PA-1 y PA-2 en ventanas de 50 kbp. (G) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones PB-1, PB-2 y PB-3 de PB en ventanas de 50 kbp. (E) relación log2 de la divergencia de secuencia de nucleótidos por pares PB-SoAm mínima (dB-SoAm) y la divergencia de secuencia de nucleótidos por pares PA-SoAm mínima (dA-SoAm) en ventanas de 50 kbp. Los colores y log2 <0 o> 0 indican que parte del genoma está más estrechamente relacionado con PA o PB, respectivamente. (F) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones de PA PA-1 y PA-2 en ventanas de 50 kbp. (G) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones PB-1, PB-2 y PB-3 de PB en ventanas de 50 kbp. (E) relación log2 de la divergencia de secuencia de nucleótidos por pares PB-SoAm mínima (dB-SoAm) y la divergencia de secuencia de nucleótidos por pares PA-SoAm mínima (dA-SoAm) en ventanas de 50 kbp. Los colores y log2 <0 o> 0 indican que parte del genoma está más estrechamente relacionado con PA o PB, respectivamente. (F) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones de PA PA-1 y PA-2 en ventanas de 50 kbp. (G) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones PB-1, PB-2 y PB-3 de PB en ventanas de 50 kbp. (F) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones de PA PA-1 y PA-2 en ventanas de 50 kbp. (G) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones PB-1, PB-2 y PB-3 de PB en ventanas de 50 kbp. (F) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones de PA PA-1 y PA-2 en ventanas de 50 kbp.(G) Divergencia de secuencia de nucleótidos por pares de la cepa SoAm en comparación con las cepas de las subpoblaciones PB-1, PB-2 y PB-3 de PB en ventanas de 50 kbp.
Aquí, informamos una segunda instancia de cruzamiento reciente entre PA y PB. Otra cepa con contribuciones bastante iguales de las dos poblaciones principales, PA (∼45%) y PB (∼55%) ( Figura 4E ), se aisló del lado este del Parque Nacional Nahuel Huapi, un área que simpatiza con todos subpoblaciones encontradas en América del Sur. Esta cepa tenía una ascendencia compleja, donde tanto PA-1 como PA-2 contribuyeron a las porciones de PA de su genoma ( Figura 4F  y  Figura S5B ), lo que indica que su padre PA ya estaba mezclado entre PA-1 y PA-2. Al igual que con las cepas mezcladas NoAm, el progenitor PB era de la subpoblación PB-1 ( Figura 4G  y  Figura S5B) Juntos, estos dos linajes mezclados muestran que se produce un cruzamiento entre las dos poblaciones principales, y que la mezcla y el flujo de genes probablemente continúan dentro de las regiones simpáticas de América del Sur.
También encontramos ejemplos de pequeñas extensiones de mezcla entre PA y PB que fueron detectables como contribuciones del 2-12%. Estas cepas introgresadas incluían la cepa de tipo taxonómico de  S. eubayanus  (CBS12357 T ), cuya secuencia del genoma se dedujo principalmente de PB-1, pero tenía una contribución de ~ 4% de PA-1 ( Figura S6 ). Encontramos varios otros ejemplos de mezcla entre PA y PB, así como mezcla entre subpoblaciones de PA o de PB (Tabla S3). Notablemente, las contribuciones de PB generalmente fueron de PB-1, la subpoblación con el rango más grande, la mayoría de los anfitriones y la firma más fuerte de expansión de la población, factores que tienden a hacer que el contacto con otras subpoblaciones sea más probable.
En nuestra colección de 200 cepas, observamos contribuciones del genoma nuclear de  S. uvarum  en cuatro cepas. Estas cuatro cepas comparten la misma introgresión de ∼150-kbp en el cromosoma XIV ( Figura S7A y B ). Cuando analizamos la porción del genoma aportada por  S. eubayanus , encontramos que todas estas cepas estaban incluidas en la subpoblación PB-1 ( Figura S7C ). El análisis de la región de 150 kbp de  S. uvarum  indicó que la  población de S. uvarum más cercana  relacionada con estas cepas introgresadas era SA-B ( Figura S7D ), una población restringida a América del Sur que no se ha encontrado previamente que contribuya a ningún conocido híbridos entre especies (Almeida y col. 2014 ). Por lo tanto, estas cepas representan un evento de hibridación independiente entre los linajes sudamericanos de estas dos especies hermanas que no está relacionado con ningún evento de hibridación conocido entre cepas industriales ( Almeida et al. 2014 ). Estas cepas muestran que  S. eubayanus  y  S. uvarum  pueden hibridarse y se hibridan en la naturaleza, pero el número limitado (n = 4) de cepas introgresadas, el pequeño tamaño de introgresión (150 kbp) y los puntos de interrupción compartidos sugieren que la persistencia de los híbridos En la naturaleza es raro.

La Patagonia Norte es un punto caliente de diversidad

La Patagonia alberga la mayor diversidad genética de  S. eubayanus  en nuestro conjunto de datos, y solo se encontraron cuatro subpoblaciones allí: PA-1, PA-2, PB-2 y PB-3 ( Figura 1A  y  4A ). Por lo tanto, examinamos la diversidad genética y las distribuciones de rango de los aislados de América del Sur más de cerca. El Parque Nacional Nahuel Huapi arrojó aislamientos de las cinco subpoblaciones encontradas en América del Sur, fue el único lugar donde se encontró PA-1 y fue el lugar donde se aisló la cepa mezclada SoAm ( Figura 5A y B ). Las cinco subpoblaciones se encontraron al norte de 43 ° S, un límite importante durante el último período de glaciación que afecta a muchos organismos ( Mathiasen y Premoli 2010 ;  Premoli et al. 2010Quiroga y Premoli 2010 ). En toda la especie, había más diversidad genética al norte de este límite ( Figura 5B ). En contraste, solo se encontraron PB-1 y PB-3 al sur de 43 ° S, con ambas distribuciones llegando a Tierra del Fuego. Las cepas más australes fueron principalmente PB-3 (89.7%), pero incluyeron dos cepas PB-1 × PB-3 altamente mezcladas (Tabla S1 y S3).

Figura 5. Diversidad genómica sudamericana versus rango, diversidad por área y aislamiento por distancia. (A) Rango y diversidad genómica de los sitios de muestreo de América del Sur. Los tamaños de los círculos corresponden a la diversidad de nucleótidos de todas las cepas de ese sitio, y las proporciones circulares corresponden a la contribución de cada subpoblación a π en cada sitio. El rango latitudinal de cada subpoblación se muestra a la derecha. (B) Diversidad de nucleótidos por subpoblación por sitio de muestreo, donde los círculos más grandes y oscuros indican más diversidad. Los “Sitios SA” en gris muestran la diversidad de todas las cepas encontradas en cada sitio sudamericano (SA). Los "sitios mundiales" en gris oscuro muestran la diversidad de nucleótidos de todas las cepas norteamericanas o no sudamericanas, independientemente de la subpoblación, en comparación con las cepas sudamericanas al sur o al norte de 43 ° S, alineado a la latitud media de todas las cepas incluidas en el análisis. (C) Correlación de la diversidad de nucleótidos y el área o distancia que cubre una subpoblación. El eje y muestra la diversidad de nucleótidos de cada subpoblación, y los tamaños de los círculos corresponden a los tamaños geográficos de las subpoblaciones en una escala log10. Tenga en cuenta que PA-1 (rojo oscuro) es tan diverso como PB-3 (azul oscuro) pero abarca un área más pequeña. (D) log10 (diversidad de nucleótidos por pares) correlacionado con la distancia entre cepas, lo que demuestra el aislamiento por distancia. Tenga en cuenta que todos los ejes y tienen una escala igual, pero no los ejes x. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1. (C) Correlación de la diversidad de nucleótidos y el área o distancia que cubre una subpoblación. El eje y muestra la diversidad de nucleótidos de cada subpoblación, y los tamaños de los círculos corresponden a los tamaños geográficos de las subpoblaciones en una escala log10. Tenga en cuenta que PA-1 (rojo oscuro) es tan diverso como PB-3 (azul oscuro) pero abarca un área más pequeña. (D) log10 (diversidad de nucleótidos por pares) correlacionado con la distancia entre cepas, lo que demuestra el aislamiento por distancia. Tenga en cuenta que todos los ejes y tienen una escala igual, pero no los ejes x. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1. (C) Correlación de la diversidad de nucleótidos y el área o distancia que cubre una subpoblación. El eje y muestra la diversidad de nucleótidos de cada subpoblación, y los tamaños de los círculos corresponden a los tamaños geográficos de las subpoblaciones en una escala log10. Tenga en cuenta que PA-1 (rojo oscuro) es tan diverso como PB-3 (azul oscuro) pero abarca un área más pequeña. (D) log10 (diversidad de nucleótidos por pares) correlacionado con la distancia entre cepas, lo que demuestra el aislamiento por distancia. Tenga en cuenta que todos los ejes y tienen una escala igual, pero no los ejes x. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1. y los tamaños de los círculos corresponden a los tamaños geográficos de las subpoblaciones en una escala log10. Tenga en cuenta que PA-1 (rojo oscuro) es tan diverso como PB-3 (azul oscuro) pero abarca un área más pequeña. (D) log10 (diversidad de nucleótidos por pares) correlacionado con la distancia entre cepas, lo que demuestra el aislamiento por distancia. Tenga en cuenta que todos los ejes y tienen una escala igual, pero no los ejes x. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1. y los tamaños de los círculos corresponden a los tamaños geográficos de las subpoblaciones en una escala log10. Tenga en cuenta que PA-1 (rojo oscuro) es tan diverso como PB-3 (azul oscuro) pero abarca un área más pequeña. (D) log10 (diversidad de nucleótidos por pares) correlacionado con la distancia entre cepas, lo que demuestra el aislamiento por distancia.Tenga en cuenta que todos los ejes y tienen una escala igual, pero no los ejes x. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1. Holarctic incluye el subgenoma de S. eubayanus de dos cepas cerveceras. La Figura S8A muestra los gráficos individuales para el linaje NoAm. La figura S8B muestra la gráfica individual de PB-1.

A pesar del rango geográfico limitado de algunas subpoblaciones, su diversidad genética era alta, y esta diversidad a menudo no escalaba con el área geográfica sobre la que se encontraban ( Figura 5C ). La distribución generalizada de algunas subpoblaciones nos llevó a preguntarnos si había aislamiento por distancia dentro de una subpoblación ( Figura 5D ). Utilizamos medidas por pares de diversidad y distancia geográfica entre cada cepa y realizamos pruebas de Mantel para cada subpoblación. Todas las subpoblaciones mostraron un aislamiento significativo por distancia (Tabla S4), excepto PA-1, probablemente porque tenía el rango geográfico más pequeño (25 km). Incluso la prueba de Mantel para el linaje menos diverso, NoAm, fue altamente significativa (p-val = 0.0001, R 2= 0,106), lo que indica que cada ubicación ha evolucionado de forma independiente después de su reciente evento de cruzamiento y dispersión compartido. A través de estos análisis por pares, también detectamos dos cepas de Cerro Ñielol, Chile, que eran inusualmente genéticamente divergentes del resto de PB-1 y que podrían ser un linaje nuevo ( Figura S8 ).

Regiones globales adicionales son climáticamente adecuadas

La distribución escasa pero global de  S. eubayanus  plantea dudas sobre si otras áreas del mundo podrían ser adecuadas para esta especie. Utilizamos el algoritmo de modelado de nicho ambiental maxent implementado en Wallace ( Kass et al.2018 ) para modelar la idoneidad climática global de  S. eubayanus , utilizando coordenadas GPS de todas las  cepas de S. eubayanus conocidas  publicadas aquí y estimaciones de coordenadas para los aislamientos de Asia Oriental ( Bing et al. 2014) Estos modelos de nicho se construyeron utilizando WorldClim Bioclims, que se basan en medidas mensuales de temperatura y lluvia, que reflejan las tendencias anuales y estacionales, así como los extremos, como los trimestres más cálidos y más fríos. Cómo las variables climáticas afectan las distribuciones de levadura es un área poco estudiada, y la construcción de estos modelos nos permitió una nueva forma de explorar la idoneidad climática.
Usando todas las ubicaciones conocidas de aislamiento ( Figura 6 ), encontramos que el mejor modelo (AIC = 2122.4) delineó con precisión la distribución conocida a lo largo de los Andes Patagónicos. En América del Norte, las cepas de las montañas olímpicas del estado de Washington y la región Blue Ridge de Carolina del Norte cayeron dentro de las áreas predichas, y curiosamente, estos sitios habían producido cepas puras de PB-1 y Holarctic. En contraste, algunas de las cepas mezcladas de NoAm se encontraron en regiones que estaban en el límite de la idoneidad en este modelo (Nuevo Brunswick y Wisconsin). En Asia, el modelo predice otras regiones adecuadas a lo largo del Himalaya que están al oeste de lugares conocidos.
Figura 6. Idoneidad climática prevista de S. eubayanus. Presencia de entrenamiento mínima (verde claro) y presencia de entrenamiento del 10º percentil (verde oscuro) basada en un modelo que incluye todos los aislamientos de S. eubayanus conocidos, así como un escenario de dispersión y diversificación fuera de la Patagonia (recuadro y flechas).Las flechas negras significan eventos de diversificación, las líneas punteadas son eventos de diversificación donde la población no se encuentra en la Patagonia, y las flechas de colores son eventos de migración para el linaje del color correspondiente. Los números romanos ordenan los posibles eventos de migración. S. eubayanus no se ha encontrado en la naturaleza en Europa, pero ha contribuido a los híbridos de fermentación, como las levaduras lager. Este escenario propone que el último ancestro común de PA y PB-Holarctic se bifurcó en PA (rojo) y PB-Holarctic (azul), que se irradiaba más a PA-1 (rojo oscuro), PA-2 (rojo claro), PB-1 (azul), PB-2 (azul más claro), PB-3 (azul oscuro) y Holarctic (azul muy claro) . Se necesitan al menos cuatro eventos de migración para explicar los lugares donde se ha encontrado S. eubayanus. I. La subpoblación Holarctic se extrajo del conjunto de genes PB-Holarctic y colonizó la ecozona Holarctic. II PB-1 colonizó la Cuenca del Pacífico, incluyendo Nueva Zelanda y el estado de Washington, EE. UU. III. Un evento de dispersión independiente trajo PB-1 a Carolina del Norte, EE. UU. IV. El cruce entre PA-2 y PB-1 dio lugar a un linaje mezclado de baja diversidad que recientemente ha invadido una gran franja de América del Norte. eubayanus ha sido encontrado. I. La subpoblación Holarctic se extrajo del conjunto de genes PB-Holarctic y colonizó la ecozona Holarctic. II PB-1 colonizó la Cuenca del Pacífico, incluyendo Nueva Zelanda y el estado de Washington, EE. UU. III. Un evento de dispersión independiente trajo PB-1 a Carolina del Norte, EE. UU. IV. El cruce entre PA-2 y PB-1 dio lugar a un linaje mezclado de baja diversidad que recientemente ha invadido una gran franja de América del Norte. eubayanus ha sido encontrado. I. La subpoblación Holarctic se extrajo del conjunto de genes PB-Holarctic y colonizó la ecozona Holarctic. II PB-1 colonizó la Cuenca del Pacífico, incluyendo Nueva Zelanda y el estado de Washington, EE. UU. III. Un evento de dispersión independiente trajo PB-1 a Carolina del Norte, EE. UU. IV. El cruce entre PA-2 y PB-1 dio lugar a un linaje mezclado de baja diversidad que recientemente ha invadido una gran franja de América del Norte.
La distribución global desigual de  S. eubayanus  nos llevó a probar si los modelos eran robustos para ser construidos solo con ubicaciones sudamericanas o solo con ubicaciones no sudamericanas ( Figura S9 ). Sorprendentemente, con solo los aislamientos sudamericanos, el modelo (AIC = 1327.32) predijo con precisión las ubicaciones de los aislamientos no sudamericanos ( Figura S9A ). Incluso el modelo construido a partir del número limitado de aislamientos de fuera de América del Sur (AIC = 558.58) todavía funcionó razonablemente bien, identificando las regiones de la Patagonia a lo largo de los Andes donde   se ha encontrado S. eubayanus ( Figura S9B) Colectivamente, estos modelos sugieren que el modelado climático puede predecir otras regiones adecuadas para los microbios eucariotas. Estos enfoques podrían usarse para dirigir futuros esfuerzos de muestreo o aplicarse a otros microbios para obtener más información sobre la ecología microbiana.
Cabe destacar que todos los modelos coinciden en que Europa es climáticamente una ubicación privilegiada para  S. eubayanus  ( Figura S9C ), pero nunca se han encontrado aislamientos puros allí, solo híbridos con  S. uvarum, S. cerevisiae o híbridos con aún más padres ( Almeida et al.2014 ). Estos híbridos con ancestros complejos se han encontrado en numerosos entornos de fermentación, lo que sugiere que S. eubayanus puro  alguna  vez existió, o todavía existe en baja abundancia o en lugares oscuros, en Europa. Por lo tanto, la falta de aislamientos silvestres de los esfuerzos de muestreo en Europa sigue siendo un enigma complejo.

Discusión

Aquí, integramos datos genómicos, geográficos y fenotípicos para 200 cepas de  S. eubayanus , la colección más grande hasta la fecha, para obtener información sobre su distribución mundial, idoneidad climática y estructura de la población. Todas las cepas pertenecen a las dos poblaciones principales descritas anteriormente ( Peris et al. 2014,  2016 ), pero con el conjunto de datos extendido, pudimos definir una estructura adicional considerable, que consta de seis subpoblaciones y dos linajes mezclados. Estas subpoblaciones tienen alta diversidad genética, alta F STy larga decadencia de LD; todas las medidas son indicativas de poblaciones grandes y parcialmente aisladas sometidas a un flujo genético limitado A pesar de esta alta diversidad genética, hubo relativamente poca diferenciación fenotípica entre las subpoblaciones. Esta dicotomía entre gran diversidad genética y diferenciación fenotípica limitada sugiere una historia demográfica compleja donde las subpoblaciones genéticamente diferenciadas se diferencian mínimamente fenotípicamente y crecen bien en una amplia gama de entornos.
A pesar de la fuerte estructura de la población, también observamos evidencia considerable de mezcla y flujo de genes. Los dos linajes recientemente mezclados tuvieron contribuciones casi iguales de las dos poblaciones principales, pero fueron el resultado de eventos cruzados independientes. La cepa mezclada SoAm se aisló de un punto de diversidad y contiene contribuciones de tres subpoblaciones. El linaje mezclado de NoAm se ha extendido por al menos cuatro ubicaciones distantes, pero todas las cepas descendieron del mismo evento de cruzamiento. Dado que PA solo se ha aislado en América del Sur, es intrigante que el linaje mezclado NoAm haya tenido éxito en tantos lugares de América del Norte. El éxito de este linaje podría explicarse parcialmente por su rendimiento igual o mejor en muchos entornos en comparación con sus poblaciones parentales (Fig. 2 ), quizás contribuyendo a su invasión de varias ubicaciones nuevas. Varias otras cepas patagónicas también revelaron grados más modestos de flujo de genes entre PA y PB. Finalmente, caracterizamos una introgresión nuclear compartida de  S. uvarum  en cuatro cepas patagónicas de  S. eubayanus , lo que demuestra que la hibridación y retrocruzamiento entre estas especies hermanas se ha producido en la naturaleza en América del Sur.
S. eubayanus  tiene una distribución biogeográfica paradójica; es abundante en la Patagonia, pero se encuentra escasamente en otros lugares con aislados remotos de América del Norte, Asia y Oceanía. La mayoría de las subpoblaciones mostraron aislamiento por distancia, pero la diversidad genética solo se amplió con un rango geográfico en un grado limitado. En la Patagonia, algunos sitios de muestreo albergan más diversidad genética que todas las ubicaciones no patagónicas juntas ( Figura 5B ). Aunque encontramos la mayor diversidad genética y el mayor número de subpoblaciones al norte de 43 ° S, el patrón de diversidad genética parece estar invertido en el lado oeste de los Andes, al menos para la subpoblación PB-1 ( Nespolo et al.2019 ) . Esta discrepancia podría deberse a diferencias en cómo se distribuyeron los refugios glaciales (Sérsic y col. 2011 ) y limitaciones en el flujo de genes entre los lados este y oeste de los Andes. Juntos, los niveles de  diversidad genética de  S. eubayanus encontrados dentro de la Patagonia, así como la restricción de cuatro subpoblaciones a la Patagonia, sugieren que la Patagonia es el origen de la mayor parte de la diversidad de  S. eubayanus , probablemente el último ancestro común de la AP y poblaciones de PB-Holarctic.
El escenario más simple para explicar la distribución y diversidad actual de  S. eubayanus  es una serie de radiaciones en la Patagonia, seguida de un puñado de eventos migratorios fuera de la Patagonia ( Figura 6) Bajo este modelo, PA y PB se habrían bifurcado en la Patagonia, posiblemente en refugios glaciales separados. El evento de migración más antiguo habría sido la dispersión del antepasado de la subpoblación Holarctic, extraída del conjunto de genes PB, hacia el hemisferio norte. Múltiples eventos de migración más recientes podrían haber resultado en las pocas cepas de PB-1 encontradas en Nueva Zelanda y los EE. UU. Las cepas del estado de Nueva Zelanda y Washington se agrupan filogenéticamente y podrían haberse diversificado desde el mismo evento de migración desde la Patagonia hacia la Cuenca del Pacífico. La cepa PB-1 de Carolina del Norte (yHKB35) es genéticamente más similar a las cepas PB-1 de la Patagonia, lo que sugiere que llegó al hemisferio norte independientemente de las cepas del Pacífico. Finalmente, las cepas mezcladas de NoAm son probablemente descendientes de una sola, y relativamente reciente, dispersión fuera de la Patagonia. Dado que la AP parece estar restringida al norte de la Patagonia, esta región podría haber sido donde se produjo la hibridación que condujo al linaje NoAm. Si bien se desconoce el vector de dispersión que trajo este linaje mezclado a América del Norte, su distribución remota y su baja diversidad muestran que ha tenido éxito rápidamente al invadir nuevos entornos.
Otros escenarios más complejos podrían explicar el limitado número de cepas que se encuentran fuera de la Patagonia. Por ejemplo, PA y PB podrían representar colonizaciones secuenciales de la Patagonia del hemisferio norte. Bajo este modelo, PA habría llegado primero y luego habría sido restringido al norte de la Patagonia por la competencia con la llegada posterior de PB. La subpoblación holártica podría interpretarse como restos de la población PB que no emigró a la Patagonia; pero las cepas PB-1 del hemisferio norte, especialmente yHKB35, parecen mucho más propensas a haber sido extraídas de un acervo genético patagónico que al revés. Además, la estructuración de las subpoblaciones de PA-1 y PA-2 y de PB-1, PB-2, y las subpoblaciones de PB-3 son particularmente difíciles de rectificar con modelos que no permiten la diversificación en América del Sur. Aún son posibles escenarios más complejos, y se requerirá más muestreo y aislamiento para dilucidar completamente la distribución de esta especie evasiva y rechazar de manera más concluyente posibles modelos biogeográficos.
S. eubayanus  tiene una estructura de población sorprendentemente paralela y una diversidad genética con su especie hermana  S. uvarum  ( Almeida et al. 2014 ;  Peris et al. 2016 ). Ambas especies son abundantes y diversas en la Patagonia, pero se pueden encontrar en todo el mundo. Ambos tienen linajes divergentes tempranos, encontrados en Asia o Australasia, que bordean ser considerados especies nuevas. En América del Sur, ambos tienen dos poblaciones principales, donde una de estas poblaciones está restringida al norte de la Patagonia (al norte de 43 ° S). Sin embargo, una diferencia importante entre la distribución de estas especies es que  se han encontrado cepas puras de  S. uvarum en Europa. Muchas dimensiones de la biodiversidad podrían estar interactuando para limitar la distribución y la estructura de la población de ambos S. eubayanus  y  S. uvarum.  En particular, sabemos muy poco acerca de la ecología local, incluida la comunidad biótica y la disponibilidad de recursos abióticos a escala microbiana, pero es probable que todos estos factores influyan en el éxito microbiano. Mostramos aquí que la asociación de sustrato y huésped varía entre subpoblaciones. En la Patagonia,  S. eubayanus  y  S. uvarum  se asocian comúnmente con  Nothofagus , donde  N. dombeyi  es el huésped preferido de  S. uvarum  ( Libkind et al. 2011 ;  Eizaguirre et al.2018) Por lo tanto, la división en nichos de los árboles hospedantes podría estar jugando un papel en la persistencia de estas especies en simpatía en la Patagonia. Sin embargo, en lugares donde   no se encuentra Nothofagus y quizás haya menos huéspedes, la exclusión competitiva entre las especies hermanas  S. eubayanus y  S. uvarum podría influir en la distribución. La competencia por un conjunto más reducido de huéspedes podría explicar por qué solo  S. uvarum  se ha encontrado en Europa como cepas puras, mientras que  S. eubayanus  no. Un segundo factor que influye en la distribución y la estructura de la población podría ser la dispersión. Las levaduras podrían migrar a través de muchas avenidas, como el viento, los insectos, las aves u otros animales ( Francesca et al. 2012 ,  2014Stefanini y col. 2012 ; Gillespie y col. 2012 ). Se ha inferido la dispersión mediada por humanos para los   linajes de vino y cerveza de S. cerevisiae y para el  linaje de S. paradoxus European / SpA ( Gallone et al. 2016 ;  Gonçalves et al. 2016 ;  Leducq et al. 2014 ;  Kuehne et al. 2007 ) Un tercer factor limitante podría ser el clima histórico de una región. Los refugios glaciales actúan como reservorios de diversidad genética aislada que permiten la expansión a nuevas áreas después del retiro glacial ( Stewart y Lister 2001 ). 43 ° S es un límite geográfico significativo debido a variables geológicas y climáticas pasadas ( Mathiasen y Premoli 2010Eizaguirre y col. 2018 ), y muchas otras especies y géneros muestran una distinción entre sus contrapartes del norte y del sur, incluidos  Nothofagus  ( Mathiasen y Premoli 2010 ;  Premoli et al. 2012 ). Las diversidades de S. eubayanus  y  S. uvarum  también se ven fuertemente afectadas por el límite de 43 ° S ( Almeida et al.2014 ;  Eizaguirre et al.2018 ), y parece probable que los microbios experimentaron algunos de los mismos efectos de glaciación que sus huéspedes. La fuerte correlación de  S. eubayanus  y  S. uvarum Las estructuras de población con 43 ° S implican además una asociación de larga data e íntima con la Patagonia.
La escasa distribución global y los complejos patrones de diversidad genética continúan generando dudas sobre el nicho y el rango potencial de  S. eubayanus . Nuestro modelo climático sugiere que partes de Europa serían ideales para  S. eubayanus . A pesar de los extensos esfuerzos de muestreo,  S. eubayanus nunca ha sido aislado en Europa ( Sampaio 2018 ). Sin embargo, la secuencia ambiental reciente de la región ITS1 específica de hongos insinuó que  S. eubayanus  puede existir en estado salvaje en Europa ( Alsammar et al.2019 ). Se justifica una considerable precaución al interpretar este resultado porque el locus de ADNr se fija rápidamente al alelo de uno de los padres en híbridos entre especies, solo hay un SNP ITS1 entre S. uvarum  y  S. eubayanus , y el conjunto de datos contenía muy pocas lecturas asignadas a  S. eubayanus . Aún así, la prevalencia de híbridos con contribuciones del linaje holarctic de  S. eubayanus  encontrado en Europa ( Peris et al.2016 ) sugiere que el linaje holarctic existe en Europa, o al menos existió históricamente, lo que le permite contribuir a muchos eventos de hibridación independientes. .
Los patrones de radiación y dispersión observados aquí reflejan la dinámica de la evolución encontrada en otros organismos ( Czekanski-Moir y Rundell 2019 ), incluidos los humanos ( Nielsen et al.2017 ). S. eubayanus  y los humanos albergan poblaciones diversas y estructuradas en África subsahariana y Patagonia, respectivamente. En estas regiones endémicas, ambas especies muestran señales de mezcla antigua y reciente entre estas poblaciones estructuradas. Ambas especies han colonizado con éxito amplias franjas del globo, con la consecuencia de repetidos cuellos de botella en la diversidad genética. Mientras que los humanos anatómicamente modernos se sometieron a una importante migración fuera de África que llevó a la población del mundo ( Nielsen et al. 2017 ),  S. eubayanus ha experimentado varios eventos migratorios de diferentes poblaciones que han llevado a una distribución global más puntual. Para ambas especies, la mezcla intraespecífica y la hibridación interespecífica parecen haber jugado un papel adaptativo en el éxito de la colonización de estas nuevas ubicaciones. En humanos, las introgresiones de hibridaciones pasadas con neandertales y denisovanos subyacen a muchos rasgos adaptativos ( Racimo et al. 2015 ), mientras que la fermentación en frío de la elaboración de cerveza no sería posible sin la criolerancia de  S. eubayanus  y la fermentación agresiva de ale domesticada. cepas de  S. cerevisiae  ( Gibson y Liti 2015) Estos paralelos ilustran cómo la dinámica biogeográfica y evolutiva observada en plantas y animales también configura la diversidad microbiana. A medida que la ecología de la levadura y la genómica de la población ( Marsit et al. 2017 ;  Yurkov 2017 ) van más allá de la hipótesis de Baas-Becking "Todo está en todas partes" de la ecología microbiana ( Baas-Becking 1934 ;  de Wit y Bouvier 2006 ), la rica dinámica de la diversidad natural que está oculto en el suelo a nuestros pies se está descubriendo.

Métodos

Aislamientos de cepas salvajes

Todos los aislamientos sudamericanos se muestrearon, aislaron e identificaron como se describió anteriormente ( Libkind et al. 2011 ;  Eizaguirre et al. 2018 ). Los aislamientos norteamericanos nuevos en esta publicación provenían de muestras de suelo o corteza de los estados norteamericanos de Washington, Wisconsin, Carolina del Norte y Carolina del Sur (Tabla S1). El enriquecimiento y aislamiento de la cepa se realizó como se describió anteriormente ( Sylvester et al. 2015 ;  Peris et al. 2016 ,  2014), con algunas excepciones en temperatura y fuente de aislamiento de carbono (Tabla S1). Específicamente, se aislaron dos cepas a 4 ° C, se aislaron ocho cepas a temperatura ambiente y se aislaron seis cepas en una fuente de carbono sin glucosa: tres en galactosa, dos en sacarosa y una en maltosa (Tabla S1).

Secuenciación del genoma completo y llamadas a SNP

La secuenciación del genoma completo se completó con lecturas de pares apareados de Illumina como se describió anteriormente ( Peris et al.2016 ;  Shen et al.2018 ). Las lecturas se alinearon con el genoma de referencia ( Baker et al. 2015 ), se llamaron SNP, se enmascararon para una cobertura baja y se conservaron para el análisis posterior como se describió anteriormente ( Peris et al. 2016 ). Una cepa, yHCT75, tuvo más de 20,000 SNP heterocigotos llamados. Esta cepa fue pseudo-en fase utilizando fases con respaldo de lectura en GATK ( McKenna et al. 2010 ) y se dividió en dos fases. Los datos de lectura corta se depositan en el Archivo de lectura corta de NCBI bajo PRJNA555221.

Análisis genómicos de población.

La estructura de la población se definió utilizando varios enfoques:  fastSTRUCTURE ( Raj et al. 2014 ),  fineSTRUCTURE ( Lawson et al. 2012 ),  SplitsTree v4 ( Huson y Bryant 2006 ), y Análisis de componentes principales con el   paquete adegenet en  R ( Jombart 2008 ). fineSTRUCTURE El análisis se completó utilizando todas las cepas y 11994 SNP. La  SplitsTree red se construyó con este mismo conjunto de cepas y SNP. fastStructure El análisis se completó con una submuestra de 5 cepas de NoAm y 150165 SNP. Probamos K = 1 a K = 10 y seleccionamos K = 6 usando el chooseK.pycomando " " en  fastSTRUCTURE. Todos los cálculos de divergencia por pares, F STy la D de Tajima para subpoblaciones se calcularon utilizando el  R paquete  PopGenome  ( Pfeifer y Wittelsbuerger 2015 ) en ventanas de 50 kbp. La divergencia por pares entre las cepas se calculó en todo el genoma usando  PopGenome . LD se calculó utilizando  PopLDdecay ( Zhang et al.2019 ). El área geográfica y la distancia de las subpoblaciones se calcularon utilizando el   paquete de geosfera en  R ( Hijmans et al.2019 ). Las pruebas de Mantel se completaron con el   paquete ade4 de  R ( Dray y Dufour 2007 ). La red F ST fue construida con  iGraph  en  R (Csardi y Nepusz 2006 ).

Proyección de nicho con Wallace

El modelado climático de  S. eubayanus  se completó utilizando el  R paquete  Wallace  ( Kass et al.2018 ). Se probaron tres conjuntos de datos de ocurrencia: uno que incluía solo coordenadas GPS para cepas de América del Sur, uno que incluía solo aislamientos no sudamericanos y uno que incluía todos los aislamientos conocidos (Tabla S1). Podríamos utilizar coordenadas GPS exactas para la mayoría de las cepas, excepto las cepas del este de Asia, donde estimamos las ubicaciones ( Bing et al. 2014) Las variables bioclimáticas de WorldClim se obtuvieron a una resolución de 2.5 minutos de arco. La extensión de fondo se estableció en "Polígono convexo mínimo" con una distancia de amortiguación de 0,5 grados y se tomaron muestras de 10.000 puntos de fondo. Utilizamos bloques de particiones espaciales. El modelo se construyó utilizando el algoritmo Maxent, utilizando las clases de entidad: L (lineal), LQ (cuadrádico lineal), H (Bisagra), LQH y LQHP (Producto de bisagra cuadrádica lineal) con 1-3 multiplicadores de regularización y el paso multiplicador valor establecido en 1. El modelo se eligió en función de la puntuación del Criterio de información de Akaike (AIC) (Tabla S5). Los mejores modelos fueron proyectados a todos los continentes, excepto a la Antártida.

Fenotipado

Las cepas se revivieron por primera vez en levadura peptona dextrosa (YPD) y se cultivaron durante 3 días a temperatura ambiente. Estos cultivos saturados se transfirieron luego a dos placas de microtitulación de 96 pocillos, para la tasa de crecimiento y el fenotipo de tolerancia al estrés. Estas placas se incubaron durante la noche. Las células se fijaron desde estas placas en placas para medir la tasa de crecimiento. Para los ensayos de crecimiento de temperatura, las células se fijaron en cuatro placas de microtitulación YPD nuevas y luego se incubaron a 0 ° C, 4 ° C, 10 ° C y 20 ° C. Para las placas de microtitulación a 0 ° C, 4 ° C y 10 ° C, la OD se midió al menos una vez al día durante dos semanas o hasta que la mayoría de las cepas habían alcanzado la fase estacionaria. El crecimiento en diferentes fuentes de carbono se midió a 20 ° C en medios MM con un 2% de la fuente de carbono respectiva. Las fuentes de carbono analizadas fueron: glucosa, galactosa, rafinosa, maltosa, maltotriosa, etanol, y glicerol. Se leyó la OD cada dos horas durante una semana o hasta la saturación. Todo el fenotipado se completó por triplicado biológico. Los datos de la fuente de carbono se truncaron a 125 horas para eliminar los artefactos debidos a la evaporación. Las curvas de crecimiento se analizaron usando el paquete grofit  ( Kahm et al. 2010 )  R para medir la saturación y la tasa de crecimiento. Luego promediamos cada cepa por triplicado. Utilizamos un ANOVA corregido con el HSD de Tukey para evaluar las interacciones de la tasa de crecimiento entre la subpoblación y la fuente de carbono o la subpoblación y la temperatura. Utilizamos el  R paquete  pvclust ( Suzuki y Shimodaira 2006 ) para agrupar y construir mapas de calor de la tasa de crecimiento por subpoblación.
El choque térmico se completó granulando 200 μl de cultivo saturado, eliminando el sobrenadante, resuspendiendo en 200 μl de YPD precalentado a 37 ° C e incubando durante una hora a 37 ° C, con un control de temperatura ambiente. La tolerancia a la congelación y descongelación se probó colocando cultivos saturados de YPD en un baño de etanol con hielo seco durante dos horas, con un control que se incubó en hielo. Después del estrés, las cepas se diluyeron en serie 1:10 tres veces y se fijaron sobre YPD sólido. Estas placas de dilución se fotografiaron después de 6 y 18 horas. CellProfiler ( Lamprecht et al., 2007 ) se utilizó para calcular los tamaños de colonia después de 18 horas, y la 3 rd (1: 1000) se usaron diluciones para análisis posteriores. Las mediciones de choque térmico se normalizaron mediante los controles de temperatura ambiente, y las mediciones de congelación y descongelación se normalizaron mediante los controles de incubación de hielo. Las interacciones estadísticas de las subpoblaciones y las respuestas al estrés se probaron como anteriormente.


Disponibilidad de datos

Todos los datos de secuenciación del genoma de lectura corta se han depositado en el Archivo de lectura corta de NCBI bajo PRJNA555221. Las accesiones de datos públicos se dan en la Tabla S1.

Contribuciones de autor

QKL, DL y CTH, concebido del estudio; Concepto y diseño refinados QLK, DP, JIE, DL y CTH; QKL realizó todos los análisis de nicho genómico y ecológico de la población; QKL y DAO secuenciaron genomas, realizaron fenotipos y análisis estadísticos, y fueron mentores de KVB y MJ; DL y CTH supervisaron el estudio; KVB, KS y MJ cepas norteamericanas aisladas y / o identificadas; JIE, MER, CAL y DL aislaron y / o proporcionaron cepas sudamericanas; y QKL y CTH escribieron el manuscrito con aportes editoriales de todos los coautores.


Divulgación de conflictos de intereses



El uso comercial de las   cepas Saccharomyces eubayanus requiere una licencia de WARF o CONICET. Las cepas están disponibles para la investigación académica en virtud de un acuerdo de transferencia de material.



Figura complementaria 1.
Visualizaciones adicionales de la estructura de la población.
(A) Árbol de red SplitsTree construido con 11994 SNP con subpoblaciones encerradas en un círculo y etiquetadas. (B) Diagrama de co-ascendencia de FineStructure construido con 11994 SNP. Los colores más azules corresponden a más similitud genética. Se han agregado cuadros para etiquetar las subpoblaciones. (C) Gráfico FastSTRUCTURE (K = 6) construido con 150165 SNP y que muestra las mismas seis subpoblaciones monofiléticas encontradas con otros enfoques. Solo se incluyeron cinco cepas de NoAm en el análisis fastSTRUCTURE.


Figura complementaria 2)
Datos fenotípicos adicionales.
(A) Gráficos de violín de recuperación del estrés, normalizados por controles. No hubo subpoblaciones significativas por interacciones de estrés. (B) Parcelas de violín de registro 10 tasas de crecimiento promedio normalizadas de cada subpoblación a 0 ° C, 4 ° C, 10 ° C y 20 ° C. * = p-val <0.05 de interacciones entre Lager y PA-2, PB-2 y PB-3 a 10 ° C; Lager y PA-1, PA-2, PB-1, PB-2 y PB-3 a 20 ° C; y PB-2 y PA-2 y NoAm a 20 ° C (C) Gráficos de violín de tasa de crecimiento media en diferentes fuentes de carbono (* = p-val <0.05). (D) Mapas de calor de subpoblación significativa por interacciones de temperatura y (E) subpoblación significativa por interacciones de fuente de carbono. Los colores más cálidos indican que la temperatura de subpoblación o la fuente de carbono en la mano izquierda tenían una tasa de crecimiento más rápida que la temperatura de subpoblación o la fuente de carbono en la parte inferior; Los colores más fríos representan el reverso. Las interacciones no significativas, basadas en múltiples correcciones de prueba, están en blanco. Los colores más intensos representan valores p más pequeños.



Figura complementaria 3.
Análisis de heterocigosidad.
(A) Resumen de todos los SNPs vs SNPs llamados heterocigotos en comparación con la cepa de tipo taxonómico para las 200 cepas incluidas en este estudio. El límite superior de la barra es el recuento total de SNP. El punto inferior corresponde a los SNP llamados heterocigotos. La línea horizontal es de 20k SNP. (B) La cepa yHCT75 (CRUB 1946) es la única cepa con> 20K SNP heterocigotos. (C) Cuando los SNP heterocigotos de yHCT75 estaban pseudo-en fase (marcados), ambas fases se agruparon con PB-1.



Figura complementaria 4.
Estadísticas genómicas adicionales de la población.
(A) Diversidad media de nucleótidos por pares ( π  * 100) para cada subpoblación a través del genoma en ventanas de 50 kbp. (B) D de Tajima a través del genoma en ventanas de 50 kbp para cada subpoblación. (C) Media F ST  en ventanas de 50 kpb para cada subpoblación en comparación con todas las subpoblaciones. (D) Pairly F ST  para cada subpoblación en comparación con PB-1.



Figura complementaria 5.
Gráficos F ST  por pares para NoAm y SoAm en comparación con todas las demás subpoblaciones.
Pairly F ST  para el linaje NoAm (A) o la cepa SoAm (B) en comparación con todas las demás subpoblaciones.



Figura complementaria 6.
La cepa de tipo taxonómico tiene un genoma mosaico.
(A) Divergencia genética por pares de la cepa de tipo taxonómico en comparación con cada subpoblación. (B) Comparación de la divergencia genética por pares de la cepa de tipo taxonómico en comparación con PA-1 y PB-1. (C)  gráfico de divergencia log 2 (como en la  Figura 4 ) que muestra regiones introgresadas de PA-1 en la cepa de tipo taxonómico.



Figura complementaria 7.
Cuatro   cepas de S. eubayanus con   introgresiones nucleares de S. uvarum .
(A) Gráficos de profundidad de cobertura de las lecturas de cuatro cepas mapeadas a los   genomas de referencia de S. uvarum  (Suva) y  S. eubayanus (Seub). (B) Zoom de la región en el cromosoma XIV donde estas cuatro cepas tienen la misma   introgresión de S. uvarum (púrpura) en un  fondo de S. eubayanus . (C) Un gráfico de PCA muestra que estas cuatro cepas pertenecen a la subpoblación PB-1 de  S. eubayanus . (D) Un diagrama de PCA muestra que la región introgresada de  S. uvarum  proviene de la subpoblación sudamericana de SA-B de  S. uvarum .



Figura complementaria 8.
Aislamiento por parcelas de distancia para NoAm y PB-1.
(A) Aislamiento por distancia para todas las cepas de NoAm. El eje y se ha reescalado en comparación con la  Figura 5  para una mejor visualización. (B) Aislamiento por distancia para la subpoblación PB-1. Las comparaciones con cepas de Cerro Ñielol están marcadas. Todas las comparaciones de cepas sudamericanas con cepas no sudamericanas están en el lado derecho.



Figura complementaria 9.
Modelos climáticos adicionales de Wallace.
(A) Modelo construido utilizando solo ubicaciones de aislamiento sudamericanas. (B) Modelo construido utilizando solo sitios no sudamericanos. (C) Comparación de modelos basados ​​en todos los sitios conocidos de  recolección de S. eubayanus , solo sitios sudamericanos o no sudamericanos. Donde los modelos coinciden es en verde oscuro, donde dos modelos acuerdan es en verde medio y donde un modelo predice que la idoneidad es en verde claro.


Expresiones de gratitud

Agradecemos a Francisco A. Cubillos por coordinar la publicación con su estudio; Sean D.  Schoville, José Paulo Sampaio, Paula Gonçalves y miembros del Laboratorio Hittinger, en particular EmilyClare P. Baker, por sus útiles comentarios y comentarios; Amanda B. Hulfachor y Martin Bontrager por preparar un subconjunto de bibliotecas Illumina; el Centro de Secuenciación de ADN del Centro de Biotecnología de la Universidad de Wisconsin para proporcionar instalaciones y servicios de secuenciación Illumina; la colección NRRL del Servicio de Investigación Agrícola (ARS), Christian R. Landry, Ashley Kinart y Drew T. Doering para las cepas incluidas en el fenotipado; Huu-Vang Nguyen para las cepas utilizadas para la comparación del genoma híbrido; y Leslie Shown, Anita R. y S. Todd Hittinger, EmilyClare P. Baker y Ryan V. Moriarty por recolectar muestras y / o aislar cepas. Este material se basa en el trabajo apoyado por la National Science Foundation bajo Grant Nos. DEB-1253634 (a CTH) y DGE-1256259 (Beca de Investigación de Graduados para QKL), el Proyecto Hatch del Instituto Nacional de Alimentos y Agricultura del USDA No. 1003258 a CTH, y en parte por el Centro de Investigación de Bioenergía del DOE Great Lakes (Oficina DOE BER de Ciencias Nos. DE-SC0018409 y DE-FC02-07ER64494 a Timothy J. Donohue). QKL también recibió el apoyo del Programa de capacitación predoctoral en genética, financiado por los Institutos Nacionales de Salud (5T32GM007133). DP es becaria Marie Sklodowska-Curie del programa de investigación e innovación Horizon 2020 de la Unión Europea (Acuerdo de subvención No. 747775). DL fue apoyado por CONICET (PIP11220130100392CO), FONCyT (PICT 3677, PICT 2542), la Universidad Nacional del Comahue (B199) y la subvención NSF-CONICET. CTH es Pew Scholar en Ciencias Biomédicas y miembro de la Facultad HI Romnes,

Referencias



La preimpresión de bioRxiv se publicó por primera vez en línea el 19 de julio de 2019; doi: http://dx.doi.org/10.1101/709535 . El titular de los derechos de autor de esta preimpresión (que
no fue revisado por pares) es el autor / financiador, que le ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo una licencia internacional CC-BY-NC 4.0.