el cromosoma
HogarHogar > Blog > el cromosoma

el cromosoma

Apr 05, 2023

Horticulture Research volumen 8, Número de artículo: 129 (2021) Citar este artículo

4466 Accesos

18 citas

1 Altmetric

Detalles de métricas

La stevia (Stevia rebaudiana Bertoni) es bien conocida por sus glucósidos de esteviol (SG) muy dulces que consisten en un esqueleto de esteviol diterpenoide tetracíclico común y una glicona variable. Los glucósidos de esteviol son entre 150 y 300 veces más dulces que la sacarosa y se utilizan como edulcorantes naturales sin calorías. Sin embargo, los compuestos más prometedores se biosintetizan en pequeñas cantidades. Con base en la secuenciación de Illumina, PacBio y Hi-C, construimos un ensamblaje a nivel de cromosoma de Stevia que cubre 1416 Mb con un valor de N50 contig de 616,85 kb y un valor de N50 de andamio de 106,55 Mb. Más de las cuatro quintas partes del genoma de Stevia consistía en elementos repetitivos. Anotamos 44 143 genes codificadores de proteínas de alta confianza en el genoma de alta calidad. El análisis de la evolución del genoma sugirió que Stevia y el girasol divergieron hace ~29,4 millones de años (Mya), poco después del evento de duplicación del genoma completo (WGD) (WGD-2, ~32,1 Mya) que ocurrió en su ancestro común. El análisis genómico comparativo reveló que los genes expandidos en Stevia se enriquecieron principalmente para la biosíntesis de metabolitos especializados, especialmente la biosíntesis de los esqueletos terpenoides, y para una mayor oxidación y glicosilación de estos compuestos. Identificamos además todos los genes candidatos involucrados en la biosíntesis de SG. En conjunto, nuestros hallazgos actuales sobre el genoma de referencia de Stevia serán muy útiles para diseccionar la historia evolutiva de Stevia y para descubrir nuevos genes que contribuyan a la biosíntesis de SG y otras características agronómicas importantes en futuros programas de mejoramiento.

Se sabe que las dietas ricas en azúcar causan graves problemas de salud como la obesidad y la diabetes1. Algunos países han aplicado impuestos al azúcar para reducir el consumo de azúcares con alto contenido calórico, una estrategia recomendada para reducir el consumo de azúcar fomentando la sustitución con edulcorantes sin calorías2. Los glucósidos de esteviol, extraídos de las hojas de Stevia, no contienen calorías y tienen una dulzura natural deseable3. Stevia rebaudiana (2n = 22) es una hierba dulce originaria de Paraguay, y el extracto de su hoja se ha utilizado como edulcorante natural durante siglos en América del Sur4. Además de la dulzura, los dos componentes abundantes de las SG, el esteviósido y el rebaudiósido A (Reb A), también pueden proporcionar beneficios terapéuticos para la diabetes tipo 2, ya que estos compuestos pueden mejorar directamente la secreción de insulina al potenciar la actividad del canal TRPM5 en modelos animales5,6. La stevia se cultiva ampliamente en Asia, América del Norte y Europa por su uso como edulcorante natural y medicina tradicional.

El género Stevia pertenece a la tribu Eupatorieae dentro de la familia Asteraceae. Entre las ~230 especies del género Stevia, S. rebaudiana es la única que contiene SGs3,7. Las SG tienen un esqueleto central de esteviol diterpenoide (aglicona) decorado con diferentes patrones de glicosilación en las posiciones C-13 y C-193,8. Estos glucósidos diterpenoides se encuentran casi exclusivamente en las hojas de Stevia y representan hasta ~20 % del peso seco9,10. El esteviósido y Reb A son los dos componentes principales de las SG, seguidos por Reb C, Reb F, dulcósido A, Reb D y Reb M. Los experimentos de etiquetado han revelado que la columna vertebral de las SG se biosintetiza a partir de unidades isoprenoides de 5 carbonos, que son predominantemente derivado de la ruta del fosfato de metileritritol (MEP)11. Las rutas biosintéticas de SG y ácido giberélico (GA) comparten cuatro pasos, y el último sustrato común de estos dos diterpenoides de tipo labdano es el ácido ent-kaurenoico12,13,14. En la ruta de biosíntesis de SG, la hidroxilasa del ácido ent-kaurenoico (ent-KAH) cataliza la 13-hidroxilación del ácido ent-kaurenoico para formar ácido ent-13-hidroxi kaurenoico (esteviol), que sirve como columna vertebral para todos los SG14,15. Luego, una serie de procesos de glicosilación de la aglicona (esteviol) catalizados por un conjunto de glicosiltransferasas (UGT) dependientes de UDP citosólicas conducen a la producción de diversos tipos de SG. La glucosa es un resto de azúcar importante en todos los SG, mientras que la ramnosa y la xilosa están presentes solo en unos pocos SG, como Reb C y dulcósido A3.

Stevia es única en su acumulación de SG, que son metabolitos secundarios de los diterpenoides y tienen pasos biosintéticos iniciales similares a los de los GA. Los GA son esenciales para el crecimiento y desarrollo normal de las plantas, y los genes involucrados en la ruta de biosíntesis de GA se conservan y regulan estrictamente en las plantas superiores16,17. Parece que la biosíntesis de SG y GA debería separarse espacial o temporalmente para evitar perturbar el metabolismo normal de GA12; sin embargo, la evolución de la acumulación de SG y los mecanismos de separación de la biosíntesis de SG y GA en Stevia siguen siendo esquivos. Después de la formación de los diterpenos tetracíclicos centrales (GA12 y esteviol), tiene lugar la oxidación y glicosilación para producir los compuestos bioactivos finales: GA y SG, respectivamente. A diferencia de los genes de oxidasa involucrados en la biosíntesis de GA, los genes de UGT que participan en la glicosilación de diterpenoides rara vez se han documentado18,19. Stevia es un modelo de planta ideal para el estudio de la glicosilación de diterpenoides, no solo porque sus hojas acumulan más de 30 tipos de SG, sino también por su ciclo de crecimiento corto y su fácil reproducción. Debido a la ausencia de la secuencia del genoma de Stevia, la mayoría de los estudios que identifican los genes UGT implicados en la glicosilación de las SG se han basado en etiquetas de secuencias expresadas o secuencias transcriptómicas, y hasta el momento solo se han caracterizado tres UGT para contribuir a la biosíntesis de las SG20,21 . Esta deficiencia ha dificultado la investigación sobre la biosíntesis de SG y, en consecuencia, ha dificultado la comprensión integral de la evolución de Stevia en Asteraceae.

En el presente estudio, generamos una secuencia genómica de referencia de alta calidad para Stevia (cv. 'Zhongshan No. 7') a través de una combinación de enfoques de secuenciación PacBio y Hi-C. Con base en esta secuencia del genoma, realizamos un análisis evolutivo de Stevia en la familia Asteraceae. Además, se identificaron conjuntos de genes candidatos involucrados en la biosíntesis de SG. Este genoma de referencia será muy útil para la comprensión evolutiva de la biosíntesis de SG y para la mejora de la calidad de Stevia en el futuro.

Las hojas del cultivar chino Stevia 'Zhongshan No. 7' se recolectaron para la secuenciación y el ensamblaje del genoma de novo. Con base en el análisis de K-mer, estimamos un tamaño de genoma de 1,16 Gb para Stevia, con tasas de heterocigosidad de 0,43 % y 73,13 % de repeticiones (Tabla complementaria 1 y Figura complementaria 1). Para ensamblar con precisión este genoma complejo con una alta tasa de secuencias repetidas, utilizamos una combinación de enfoques de secuenciación Illumina de lectura corta, secuenciación PacBio de lectura larga y secuencia Hi-C. Obtuvimos 114,96 Gb de sublecturas de secuenciación de PacBio, lo que proporciona una cobertura de ~99,5 veces del genoma de Stevia (Tabla complementaria 2). Estas sublecturas se ensamblaron en un genoma de 1405 Mb que contenía 6978 contigs, con un valor de contig N50 de 616,85 kb, y el contig más largo tenía 26,27 Mb de longitud (Tabla complementaria 3). Se generaron un total de 76,86 Gb de datos limpios Hi-C, de los cuales el 90,42 % de las lecturas se asignaron a los contigs ensamblados (Tabla complementaria 4). Bajo la guía de los datos de Hi-C, agrupamos con éxito 6358 contigs en 11 pseudocromosomas y orientamos el 91,28% del ensamblaje de acuerdo con una estrategia de agrupación jerárquica22 (Tabla complementaria 5 y Figura complementaria 2). El ensamblaje final de Stevia a nivel cromosómico tenía una longitud de 1416 Mb, con un tamaño de andamio N50 de 106,55 Mb (Tabla 1).

Utilizamos una combinación de tres fuentes de datos para evaluar la integridad del ensamblaje del genoma de Stevia. Primero, alineamos nuestros datos de Illumina con el genoma ensamblado y se mapeó el 98,14 % de las lecturas limpias (Tabla complementaria 6). Se identificaron un total de 451 de los 458 genes eucariotas centrales (CEG) en nuestro ensamblaje actual del genoma de Stevia (Tabla complementaria 7). Además, el análisis BUSCO23 reveló que el 86,04 % de los BUSCO completos estaban presentes en el ensamblaje de Stevia (Tabla complementaria 8). Todos estos hallazgos sugirieron que el genoma de Stevia ensamblado tenía una gran integridad y precisión.

Anotamos los elementos repetitivos del genoma de Stevia mediante métodos basados ​​en homología y predicción in silico, y se determinó que el 80,11 % del conjunto estaba compuesto por elementos repetitivos. Entre ellos, los retrotransposones representaron el 69,45% y los transposones de ADN representaron el 5,83%. Más del 65 % del genoma de Stevia constaba de retrotransposones repetidos terminales largos (LTR-RT), de los cuales el 32,30 % pertenecía al linaje Copia y el 66,76 % pertenecía al linaje Gypsy (Tabla complementaria 9). No fue sorprendente que un contenido tan alto de LTR-RT estuviera presente en el genoma de Stevia, ya que las LTR-RT también están presentes en grandes proporciones en otras especies de Asteraceae, como Helianthus annuus (girasol)24, Lactuca sativa (lechuga)25, y Chrysanthemum nankingense26. Para la anotación de genes que codifican proteínas, utilizamos una combinación de tres métodos: métodos de predicción basados ​​en homología, ab initio y asistidos por RNA Seq. Finalmente, se predijeron 44 143 genes codificadores de proteínas en nuestro ensamblaje Stevia actual, con una longitud génica promedio de 3493 pb (Tabla 1). El análisis del transcriptoma mostró que 37.489 genes predichos (84,93 %) estaban respaldados por al menos uno de los siete órganos (raíz, tallo y hojas en cinco etapas de desarrollo diferentes). En general, a 41 801 genes codificadores de proteínas (94,69 %) se les asignaron funciones en al menos una de las cinco bases de datos (NR, TrEMBL, KOG, KEGG y GO) (Tabla complementaria 10), y 40 355 estaban anclados en los 11 pseudocromosomas. La figura 1b-e muestra la densidad de Copia, la densidad de Gypsy, la densidad de genes y el nivel transcripcional de cada pseudocromosoma.

a Representación circular de las pseudomoléculas (Mb). b Densidad de Copia LTR-RT. c Densidad de Gypsy LTR-RT. d Densidad de genes. e Niveles medios de transcripción, log2(RPKM). f Contenido de GC. g Bloques sinténicos a través de las pseudomoléculas de Stevia. Lecturas RPKM por kb por millón de lecturas

Para comprender la relación evolutiva entre Stevia y otras plantas Asteraceae, realizamos un análisis genómico comparativo utilizando Vitis vinifera, Solanum lycopersicum, Daucus carota y cinco plantas Asteraceae (L. sativa, C. nankingense, Artemisia annua, H. annuus y S .rebaudiana). El análisis filogenético basado en 799 genes ortólogos de una sola copia identificados en estas ocho especies confirmó la estrecha relación entre Stevia y el girasol (alianza Heliantheae) y entre C. nankingense y A. annua (tribu Anthemideae) (Fig. 2a). El tiempo de divergencia estimado de Stevia y girasol fue hace ~28-31 millones de años (Mya). El ancestro común más reciente (MRCA) de la stevia y el girasol divergió del MRCA de C. nankingense y A. annua ~37–38 Mya, lo que es consistente con los hallazgos de Song et al.26. El MRCA de Stevia y C. nankingense divergió de la lechuga ~39–40 Mya (Fig. 2a).

un árbol filogenético de Stevia y otras siete plantas basado en 799 genes ortólogos de una sola copia. b Distribuciones Ks. Eje y izquierdo, ortólogos de Stevia-girasol (azul), ortólogos de Stevia-lechuga (naranja); eje y derecho, paralogues de Stevia (verde), paralogues de girasol (verde oscuro), paralogues de lechuga (morado). c Bloques Synteny de Stevia-lechuga-girasol

Investigamos más a fondo los eventos de duplicación del genoma completo (WGD) durante la evolución de Stevia, ya que WGD se ha considerado una fuente importante de novedad genética, bioquímica y evolutiva de las plantas27,28,29. Identificamos 5209 pares de genes parálogos que representaron el 20,69 % de los genes de Stevia previstos utilizando el paquete MCScanX30. La distribución de Ks de estos pares de genes duplicados alcanzó un máximo de 0,53, lo que refleja la aparición de un evento WGD ~ 32,1 Mya (Fig. 2b). Con base en la distribución de Ks de los pares de genes ortólogos entre Stevia y girasol, estimamos que su tiempo de divergencia fue de ~29,4 millones de años, lo que indica que divergieron poco después del evento WGD (WGD-2) experimentado por su ancestro común24. La distribución Ks de los pares de genes homólogos ilustró claramente que la triplicación del genoma completo (WGT-1, ~45.5–51.5 Mya) ocurrió en la lechuga (Fig. 2b), que también se cree que ocurrió en la ascendencia de la mayoría de las Asteraceae24,25, 26,31. Este análisis mostró que Stevia experimentó una historia evolutiva complicada caracterizada por un WGD-2 reciente compartido con el girasol, el WGT-1 basal en Asteraceae y el evento de paleohexaploidía ancestral (WGT-γ) que ocurrió en todas las eudicots32. Por lo tanto, para cualquier región ancestral del MRCA de Asteraceae (post-WGT-1), actualmente se espera que existan dos regiones heredadas en los genomas de Stevia y girasol en comparación con el genoma de la lechuga (Fig. 2c). Aunque Stevia y el girasol experimentaron los mismos eventos de paleopoliploidía (WGT-γ, WGT-1 y WGD-2) y hubo muchas regiones colineales entre sus genomas (Figura 3 complementaria), estas dos especies pueden haber sufrido diferentes patrones de reordenamiento cromosómico y pérdida de genes duplicados después de la divergencia, lo que da como resultado diferentes números de cromosomas y tamaños de genoma.

Según la homología de secuencia, se identificaron un total de 41 701 familias de genes que contenían 276 277 genes utilizando los genes predichos de las ocho plantas anteriores (siete de asterids y V. vinifera como un grupo externo) (Fig. 3a y Tabla complementaria 11). De estos, 5749 familias de genes que consisten en 68,964 genes se compartieron entre las ocho plantas, y 12,326 se compartieron entre las cinco plantas de Asteraceae (Fig. 3b). Asignamos 40 214 genes de Stevia a 20 147 familias y descubrimos que 1057 familias de genes contenían 4281 genes exclusivos de Stevia. El análisis de enriquecimiento de Gene Ontology (GO) reveló que estas familias de genes únicas estaban involucradas principalmente en la actividad de la polimerasa de ADN dirigida por ARN (GO: 0003964), la actividad de endopeptidasa de tipo aspártico (GO: 0004190) y la unión de ARN (GO: 0003723) (Suplementario Figura 4).

a Los números rojos y azules asignados al árbol filogenético de especies indican familias de genes que sufrieron expansión y contracción, respectivamente. b Diagrama de Venn de familias de genes compartidos en Stevia y otras cuatro plantas de Asteraceae. c Árbol filogenético de la familia de genes de la terpeno sintasa (TPS) en Stevia. Las subfamilias TPS están etiquetadas

Un análisis adicional de la familia de genes demostró que 323 familias de genes se expandieron en el genoma de Stevia, mientras que 346 se contrajeron (Fig. 3a). El análisis de enriquecimiento GO de las familias de genes expandidos de Stevia reveló que estaban enriquecidos para la actividad de transferasa (GO: 0016758), actividad de monooxigenasa (GO: 0004497), unión de ADP (GO: 0043531), actividad catalítica (GO: 0003824) y terpeno actividad sintasa (GO: 0010333) (Fig. 5 complementaria). El análisis de enriquecimiento de KEGG reveló que las familias de genes expandidos de Stevia se enriquecieron principalmente para la biosíntesis de fenilpropanoides (ko00940), biosíntesis del esqueleto de terpenoides (ko00900), biosíntesis de flavonoides (ko00941), biosíntesis de monoterpenoides (ko00902), metabolismo de cianoaminoácidos (ko00460) y sesquiterpenoides y biosíntesis de triterpenoides (ko00909) (Fig. 6 complementaria). Los análisis de enriquecimiento de GO y KEGG demostraron que un número considerable de estas familias de genes expandidos participaron en la biosíntesis de metabolitos especializados. Como la vía de biosíntesis de terpenoides se enriqueció varias veces, investigamos más a fondo el patrón de expansión de la familia de genes de la terpeno sintasa (TPS), que impulsa la diversificación de los terpenoides. Se identificaron ochenta y dos genes TPS en el genoma de la stevia, que podrían dividirse en cinco subfamilias. Más de las tres cuartas partes de los genes TPS de Stevia se clasificaron en las subfamilias TPS-a y TPS-b, lo que indica una expansión significativa de estas dos subfamilias (Fig. 3c).

La acumulación de grandes cantidades de SG en las hojas es la característica más notable de Stevia. Aunque la ruta biosintética de SG se ha estudiado ampliamente durante las últimas dos décadas, y aunque algunos de los genes UGT críticos se han caracterizado bien21,33, obtuvimos nuevos conocimientos sobre la biosíntesis de SG al combinar análisis genómicos y transcriptómicos. Todos los terpenos se derivan de unidades isoprenoides de 5 carbonos producidas a través de la vía MEP o la vía del mevalonato (MVA)34. Los genes candidatos en las vías MEP y MVA se identificaron mediante búsqueda de homólogos y métodos de anotación funcional. El análisis del transcriptoma reveló que casi todos los genes candidatos en la vía MEP se expresaron en siete tejidos seleccionados, incluidas hojas en diferentes etapas de desarrollo, con una alta acumulación de SG (Fig. 4). Sin embargo, los niveles de expresión de HMGR y MK en la ruta MVA fueron deficientes en las hojas, lo que indica que la unidad de isoprenoide de 5 carbonos para la biosíntesis de SG proviene principalmente de la ruta MEP en lugar de la ruta MVA, lo que es consistente con las conclusiones derivadas de los resultados de los experimentos de etiquetado11.

un diagrama que representa la ruta de biosíntesis de SG. Dentro del cuadro punteado se encuentra la ruta de biosíntesis única de SG en Stevia. b Patrones de expresión de genes candidatos de la ruta de biosíntesis de SGs. Raíz RS en la etapa de plántula, tallo SS en la etapa de plántula, hoja LS en la etapa de plántula, hoja LV en la etapa vegetativa, hoja LB en la etapa de brote, hoja LIF en la etapa de floración inicial, hoja LPF en la etapa de floración máxima

Dado que la biosíntesis de SG comparte cuatro pasos con la biosíntesis de GA antes de la generación de ácido ent-kaurenoico, identificamos todos los genes candidatos involucrados en esta vía común, incluidos 14 genes de geranilgeranil difosfato (GGPP) sintasa (GGPPS), siete ent-copalyl genes de difosfato sintasa (ent-CPS), cinco genes de ent-kaureno sintasa (ent-KS) y seis genes de ent-kaureno oxidasa (ent-KO) (Fig. 4). Los cuatro tipos de genes eran genes multicopia en el genoma de Stevia, y los genes homólogos mostraron diferenciación de expresión (Fig. 4b), lo que refleja la subfuncionalización o neofuncionalización de estos genes duplicados. Stevia ha evolucionado para biosintetizar SG en función de los primeros pasos conservados de la ruta de biosíntesis de GA en plantas vasculares.

La biosíntesis de glucósidos de esteviol diverge de la biosíntesis de GA con la 13-hidroxilación del ácido ent-kaurenoico por ent-KAH. La evolución de ent-KAH a partir de numerosos P450 fue el paso clave de la biosíntesis de SG en Stevia; sin embargo, la clonación de su gen codificante aún no ha tenido éxito3,35. Varios genes potenciales de ent-KAH de Stevia se han depositado en la base de datos del NCBI y la mayoría pertenecen a la familia CYP716. Por el contrario, se ha informado que CYP714A2, un miembro de la familia CYP714 de Arabidopsis thaliana, cataliza la 13-hidroxilación del ácido ent-kaurenoico cuando se expresa en levadura36. Por lo tanto, identificamos a todos los miembros putativos de las familias CYP716 y CYP714 en el genoma de Stevia. Hubo una expansión significativa de los genes CYP716, y cuatro genes duplicados en tándem (Streb.1G007430, Streb.1G007460, Streb.1G007470 y Streb.1G007480) se expresaron constantemente en hojas con biosíntesis de SG (Fig. 7 complementaria). Por el contrario, solo había un miembro de la familia CYP714 en el genoma de Stevia (Streb.8G019490) y apenas se expresaba en las hojas (Fig. 4b). Después de la formación de esteviol, los procesos continuos de glicosilación catalizados por un conjunto de UGT conducen a diferentes tipos de SG (Fig. 4a). Los genes UGT estaban muy enriquecidos (GO:0016758, P < 0,001) entre las familias de genes expandidos de Stevia. En total, identificamos 259 genes UGT putativos en el genoma de Stevia, y 86 genes UGT se expresaron en al menos dos de los cinco tejidos de hoja seleccionados (Fig. 8 complementaria), incluidos tres genes UGT que se ha informado que están involucrados en SG biosíntesis (UGT85C2, UGT74G1 y UGT76G1). El descubrimiento de estos genes UGT candidatos a través de análisis genómicos y transcriptómicos acelerará la identificación de genes UGT implicados en la glicosilación SG específica.

La obesidad es un grave problema de salud mundial que afecta a millones de personas, y una dieta rica en azúcar es una de las principales causas de la obesidad. Reducir la ingesta de azúcar mediante la sustitución con edulcorantes sin calorías es una forma eficaz de reducir el consumo de energía alimentaria. Aunque los edulcorantes artificiales como la sacarina, el aspartamo y la sucralosa se agregan ampliamente a varios productos alimenticios de uso diario, la ingesta a largo plazo de estos sustitutos del azúcar puede presentar riesgos para la salud37,38. Existe una fuerte demanda de edulcorantes naturales sin calorías, y los SG pueden ser los candidatos más prometedores. Los glucósidos de esteviol han sido aprobados por las autoridades reguladoras más importantes del mundo para su uso en alimentos y bebidas. Altos rendimientos y mejoras en los niveles de los SG de mejor sabor, como Reb A, Reb D y Reb M, son actualmente los principales objetivos para el mejoramiento de Stevia.

Hasta el momento, no ha habido análisis integrales que combinen métodos genómicos y transcriptómicos para brindar información detallada sobre los diterpenos únicos (SG) de Stevia. Todavía es un gran desafío construir un ensamblaje del genoma de Stevia de alta calidad basado solo en la secuenciación de segunda generación debido al gran tamaño y la alta complejidad del genoma, así como al porcentaje de repeticiones39. Aquí, proponemos un ensamblaje del genoma a nivel cromosómico de Stevia. Se obtuvo el genoma de Stevia que abarca 1416 Mb, con un contig N50 de 616,85 kb y un scaffold N50 de 106,55 Mb. Predijimos 44.143 genes que codifican proteínas en nuestro ensamblaje actual utilizando métodos de predicción basados ​​en homología, ab initio y asistidos por RNA Seq; este número es casi el doble que el del genoma anterior ensamblado mediante secuencias cortas de segunda generación (24.994), probablemente porque previamente solo se habían ensamblado 411 Mb del genoma39. Por lo tanto, el genoma ensamblado usando secuencias largas y enfoques Hi-C en este estudio es superior al genoma ensamblado previamente usando solo secuencias cortas.

Más de las cuatro quintas partes del genoma de Stevia consistía en elementos repetitivos, de los cuales el 21,02% pertenecía al linaje Copia y el 43,44% al linaje Gypsy. En girasol, más de las tres cuartas partes del genoma estaba compuesto por LTR-RT, de las cuales el 59,9% pertenecía al linaje Gypsy y el 25,8% al linaje Copia24. En C. nankingense, los elementos repetitivos ocuparon el 69,6% del genoma, siendo los LTR-RT (Gypsy y Copia) los más abundantes26. Tener muchas secuencias repetitivas, especialmente LTR-RT, podría ser una característica importante de la familia Asteraceae, que contribuye al tamaño del genoma de sus miembros.

Los análisis genómicos comparativos de Stevia y otras plantas de Asteraceae han proporcionado pistas cruciales sobre la evolución del genoma de Stevia en Asteraceae. Nuestros resultados mostraron que Stevia y el girasol divergieron ~29.4 Mya, poco después del evento WGD (WGD-2, ~32.1 Mya) que ocurrió en su MRCA (Fig. 2a, b). Stevia, un miembro de la familia Asteraceae, también experimentó un evento basal WGT-1 en Asteraceae, y un evento WGT-γ ocurrió en todas las eudicots24,25,32. La mayoría de los bloques sinténicos presentes en el genoma de Stevia se derivaron del reciente evento WGD-2, mientras que los bloques sinténicos derivados de eventos antiguos WGT-1 rara vez se conservaron (Fig. 2b). Después de separarse de un ancestro compartido con el girasol, Stevia evolucionó para sintetizar SG, metabolitos únicos que no se encuentran en otras plantas. La expansión de familias de genes específicos puede desempeñar un papel importante en la promoción de la diversificación fenotípica, así como en la evolución de nuevos rasgos en las plantas40,41. Los genes expandidos en Stevia se enriquecieron principalmente para la biosíntesis de metabolitos especializados, especialmente la biosíntesis de los esqueletos terpenoides, y para una mayor oxidación y glicosilación de estos compuestos (Figuras complementarias 5, 6). Además, identificamos todos los genes candidatos en la vía de la biosíntesis de SG en función de las secuencias del genoma y descubrimos que los genes esenciales responsables de la biosíntesis de esteviol eran genes de copias múltiples (Fig. 4b). Estos genes duplicados podrían contribuir de manera importante a la capacidad de Stevia para sintetizar SG. Por lo tanto, este ensamblaje del genoma a nivel cromosómico de alta calidad sin duda beneficiará a los investigadores en la exploración de las características de Stevia.

Las hojas jóvenes frescas presentes durante la etapa de plántula de 'Zhongshan No. 7', una especie de Stevia diploide cultivada, se recolectaron del laboratorio de recursos de germoplasma de Stevia ubicado en el Jardín Botánico de Nanjing Mem. Sun Yat-sen. El ADN genómico se aisló para la secuenciación Illumina y PacBio. Para la secuenciación de Illumina, se construyó y secuenció una biblioteca de lectura corta (270 pb) en una plataforma Illumina HiSeq (Illumina, CA, EE. UU.) y se obtuvieron 141,90 Gb de lecturas limpias. Para la secuenciación de PacBio, el ADN genómico se fragmentó a ~20 kb para construir una biblioteca de lectura larga de acuerdo con las instrucciones del fabricante (Pacific Biosciences, CA, EE. UU.), y luego la biblioteca se secuenció en una plataforma PacBio Sequel. Después de filtrar las lecturas de baja calidad y los adaptadores de secuencia, obtuvimos 114,95 Gb de sublecturas limpias con un valor N50 de 12,82 kb.

Para el ensamblaje del genoma de novo, primero usamos Canu (v1.5)42 para corregir posibles errores en las sublecturas de PacBio. Luego, las sublecturas de PacBio de alta calidad se ensamblaron de forma independiente utilizando WTDBG (v1.2.8), FALCON (v0.7)43 y Canu (v1.5). Estas tres estrategias de ensamblaje produjeron ensamblajes de 1,36, 3,25 y 2,03 Gb, y los tamaños N50 contig de estos tres ensamblajes fueron 205,51, 59,71 y 277,70 kb, respectivamente. Además, fusionamos los ensamblajes WTGDB y Canu bien ensamblados utilizando Quickmerge44. Para corregir los errores de indel y SNP en la secuencia de ensamblaje, asignamos lecturas de Illumina de dos extremos al ensamblaje fusionado mediante Pilon45. Finalmente, el tamaño del genoma ensamblado con lecturas largas de PacBio fue de 1,40 Gb con un valor N50 de 616,85 kb (Tabla complementaria 3). Para evaluar la calidad del ensamblaje, usamos BWA46 para mapear las lecturas de extremos emparejados cortos a los contigs optimizados y luego realizamos análisis CEGMA47 y BUSCO23.

La secuenciación Hi-C para el ensamblaje del genoma a nivel de cromosoma se realizó como se describió anteriormente48. Brevemente, las hojas jóvenes frescas presentes en la etapa de plántula de 'Zhongshan No. 7' se recolectaron y fijaron en una solución de formaldehído. Se utilizó HindIII para digerir la cromatina extraída de las hojas fijadas. A continuación, los fragmentos de ADN se ligaron entre sí para formar uniones quiméricas después de la biotinilación. A continuación, las uniones quiméricas enriquecidas se cortaron físicamente en fragmentos de ADN de 300 a 700 pb de longitud. Los fragmentos de ADN que contenían biotina se enriquecieron mediante la extracción de estreptavidina y luego se sometieron a secuenciación Illumina HiSeq. Finalmente, se generaron ~76,86 Gb de lecturas Hi-C limpias.

Se utilizó HiC-Pro49 para evaluar los datos de secuenciación de Hi-C. Los datos de secuenciación de Hi-C se asignaron a contigs ensamblados utilizando BWA-aln46. Los andamios preensamblados se dividieron en segmentos de 50 kb en promedio y se unieron con lecturas mapeadas únicas para el ensamblaje utilizando el software LACHESIS22. Para evaluar los conjuntos de cromosomas finales, los dividimos en contenedores de igual longitud (100 kb) y visualizamos la matriz de interacción en un mapa de calor.

Se utilizaron búsquedas de novo y alineaciones basadas en homología para predecir secuencias repetitivas en todo el genoma de Stevia. Primero usamos PILER-DF (v2.4)50, RepeatScout (v1.0.5)51 y LTR_FINDER (v1.05)52 para predecir secuencias repetitivas de novo y las clasificamos en familias usando PASTEClassifier53. Luego usamos RepeatMasker (v4.0.6)54 para escanear la base de datos integrada de las secuencias repetitivas de novo y la conocida biblioteca Repbase55 TE.

Utilizamos enfoques basados ​​en homología, ab initio y asistidos por RNA Seq para predecir genes que codifican proteínas en el ensamblaje del genoma de Stevia. Augustus56, GlimmerHMM57, SNAP58 y GeneID59 se utilizaron para programas ab initio. En predicciones homólogas, las secuencias de proteínas de A. thaliana, H. annuus, L. sativa y Oryza sativa de Phytozome se descargaron y alinearon con el genoma ensamblado de Stevia usando TBLASTN60. Luego alineamos las secuencias genómicas homólogas contra las proteínas correspondientes para construir los modelos genéticos exactos de codificación de proteínas utilizando GeMoMa61. Para las predicciones asistidas por RNA Seq, las lecturas de secuenciación de RNA de diferentes órganos de Stevia se mapearon en el ensamblaje, y las transcripciones de estos resultados de mapeo se identificaron utilizando GeneMarkS-T62 y TransDecoder (https://github.com). Integramos todos los modelos de genes obtenidos de los tres procedimientos de anotación anteriores con EVM63 para construir un conjunto de consenso final y luego lo filtramos con PASA (v2.0.2)64. Estos genes codificadores de proteínas pronosticados luego se asignaron a BLAST contra bases de datos públicas, incluidas las bases de datos de proteínas no redundantes TrEMBL65 y NCBI. Blast2GO66 se utilizó para determinar las funciones y las vías en función de las bases de datos GO67 y KEGG68.

Se identificaron grupos ortólogos entre las ocho plantas (V. vinifera, S. lycopersicum, D. carota, L. sativa, C. nankingense, A. annua, H. annuus y S. rebaudiana) utilizando OrthoMCL69. Las comparaciones de todos contra todos se realizaron con BLASTP (valor E: 1e-05), y los grupos ortólogos se agruparon con OrthoMCL. Usamos MAFFT70 para alinear las secuencias de proteínas de 799 genes de una sola copia, eliminamos las regiones mal alineadas con Gblocks71 y concatenamos los resultados de la alineación para el análisis filogenético usando RAxML (v8.0.0)72. Estimamos los tiempos de divergencia de las especies usando MCMCTREE (v4.0) dentro del paquete PAML73. Los tiempos de divergencia estimados para V. vinifera-H. annuus (111-131 millones de años), S. lycopersicum-D. carota (95-106 Mya) y L. sativa-A. annua (34–40 Mya) en TimeTree (http://www.timetree.org) se utilizaron para calibrar el árbol. La expansión y contracción de las familias de genes agrupadas por OrthoMCL en las ocho plantas se determinaron con CAFÉ (v4.2)74.

Las comparaciones de secuencias de proteínas de todos contra todos se realizaron utilizando BLASTP (valor E: 1e-05) para identificar pares de genes homólogos. Los bloques sinténicos dentro y entre especies se determinaron usando MCScanX30. El script de Perl 'add_ka_and_ks_to_collinearity.pl'. implementado en el paquete MCScanX se utilizó para calcular los valores de Ks de los pares de genes homólogos colineales. Para cinco especies de Asteraceae, se aplicó la tasa de sustitución neutral de los asteridos (r = 8.25E−9) para calcular la fecha de divergencia del WGD o eventos de especiación24. Se dibujaron un diagrama de bloques sinténicos de Stevia-lechuga-girasol y un gráfico de puntos de genes codificantes entre Stevia y girasol con TBtools75. Se produjo una imagen de los bloques sinténicos y las características genómicas en el genoma de Stevia con Circos (v0.69)76.

Las lecturas cortas de Illumina y las lecturas largas de PacBio se han depositado en la base de datos NCBI SRA con el ID de BioProyecto PRJNA684944. Los datos del transcriptoma se han depositado en la base de datos NCBI SRA bajo BioProject ID PRJNA705537. El ensamblaje final del genoma a escala cromosómica y los datos de anotación se han depositado en la base de datos de Figshare (https://doi.org/10.6084/m9.figshare.14169491.v1).

Wu, D. et al. La fosforilación de TET2 regulada por glucosa por AMPK revela una vía que vincula la diabetes con el cáncer. Naturaleza 559, 637–641 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Yang, T. et al. El reconocimiento hidrofóbico permite que la glicosiltransferasa UGT76G1 catalice su sustrato en dos orientaciones Cristalización de la ciencia del azúcar. Nat. común 10, 3214 (2019).

Ceunen, S. & Geuns, JM Glicósidos de esteviol: diversidad química, metabolismo y función. J.Nat. Pinchar. 76, 1201–1228 (2013).

Artículo CAS PubMed Google Académico

Yadav, AK, Singh, S., Dhyani, D. & Ahuja, PS Una revisión sobre la mejora de la stevia [Stevia rebaudiana (Bertoni)]. Poder. J. Planta Sci. 91, 1–27 (2011).

Artículo Google Académico

Chatsudthipong, V. & Muanprasat, C. Stevioside y compuestos relacionados: beneficios terapéuticos más allá de la dulzura. Farmacol. El r. 121, 41–54 (2009).

Artículo CAS PubMed Google Académico

Philippaert, K. et al. Los glucósidos de esteviol mejoran la función de las células beta pancreáticas y la sensación gustativa mediante la potenciación de la actividad del canal TRPM5. Nat. común 8, 14733 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Ceunen, S. et al. Glucósidos diterpénicos de Stevia phlebophylla A. Gray. Carbohidr. Res. 379, 1–6 (2013).

Artículo CAS PubMed Google Académico

Brandle, JE, Starratt, AN & Gijzen, M. Stevia rebaudiana: sus propiedades agrícolas, biológicas y químicas. Poder. J. Planta Sci. 78, 527–536 (1998).

Artículo CAS Google Académico

Geuns, JMC Esteviósido. Fitoquímica 64, 913–921 (2003).

Artículo CAS PubMed Google Académico

Lemus-Mondaca , R. , Vega-Galvez , A. , Zura-Bravo , L. & Ah-Hen , K. Stevia rebaudiana Bertoni , fuente de un edulcorante natural de alta potencia: una revisión exhaustiva de los aspectos bioquímicos, nutricionales y funcionales aspectos. Química alimentaria 132, 1121–1132 (2012).

Artículo CAS PubMed Google Académico

Wolwer-Rieck, U., May, B., Lankes, C. & Wust, M. Contribuciones de la vía del metileritritol y mevalonato a la biosíntesis de mono, sesqui y diterpenos en tricomas glandulares y hojas de Stevia rebaudiana Bertoni. J. Agric. Química alimentaria 62, 2428–2435 (2014).

Artículo PubMed CAS Google Académico

Richman, AS et al. Síntesis de diterpenos en Stevia rebaudiana: reclutamiento y regulación positiva de enzimas clave de la vía biosintética de giberelinas. Planta J. 19, 411–421 (1999).

Artículo CAS PubMed Google Académico

Humphrey, TV, Richman, AS, Menassa, R. & Brandle, JE Organización espacial de cuatro enzimas de Stevia rebaudiana que están involucradas en la síntesis de glucósidos de esteviol. Planta Mol. Biol. 61, 47–62 (2006).

Artículo CAS PubMed Google Académico

Brandle, JE & Telmer, PG Biosíntesis de glucósidos de esteviol. Fitoquímica 68, 1855–1863 (2007).

Artículo CAS PubMed Google Académico

Kim, KK, Sawa, Y. & Shibata, H. Hidroxilación de ácido ent-kaurenoico a esteviol en Stevia rebaudiana Bertoni-purificación y caracterización parcial de la enzima. Arco. Bioquímica Biografía. 332, 223–230 (1996).

Artículo CAS PubMed Google Académico

Zi, JC, Mafu, S. & Peters, RJ ¡Hasta las giberelinas y más allá! Estudio de la evolución del metabolismo de los (di)terpenoides. año Rev. Plant Biol. 65, 259–286 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Yamaguchi, S. Metabolismo de giberelinas y su regulación. año Rev. Plant Biol. 59, 225–251 (2008).

Artículo CAS PubMed Google Académico

Nagatoshi, M. et al. UGT75L6 y UGT94E5 median la glucosilación secuencial de crocetina a crocina en Gardenia jasminoides. FEBS Lett. 586, 1055–1061 (2012).

Artículo CAS PubMed Google Académico

Sol, Y. et al. Las UDP-glucosiltransferasas diterpenoides del té dulce chino y la ashitaba completan la biosíntesis de rubusósido. mol. Planta 11, 1308–1311 (2018).

Artículo CAS PubMed Google Académico

Brandle, JE, Richman, A., Swanson, AK & Chapman, BP Leaf Ests de Stevia rebaudiana: un recurso para el descubrimiento de genes en la síntesis de diterpenos. Planta Mol. Biol. 50, 613–622 (2002).

Artículo CAS PubMed Google Académico

Richman, A. et al. La genómica funcional descubre tres glucosiltransferasas involucradas en la síntesis de los principales glucósidos dulces de Stevia rebaudiana. Planta J. 41, 56–67 (2004).

Artículo CAS Google Académico

Burton, JN y col. Andamiaje a escala cromosómica de ensamblajes de genoma de novo basados ​​en interacciones de cromatina. Nat. Biotecnología. 31, 1119–1125 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Simão, FA et al. BUSCO: evaluación del ensamblaje del genoma y la integridad de la anotación con ortólogos de una sola copia. Bioinformática 31, 3210–3212 (2015).

Artículo PubMed CAS Google Académico

Badouin, H. et al. El genoma del girasol proporciona información sobre el metabolismo del aceite, la floración y la evolución de Asterid. Naturaleza 546, 148–152 (2017).

Artículo CAS PubMed Google Académico

Reyes-Chin-Wo, S. et al. Ensamblaje del genoma con datos de ligadura de proximidad in vitro y triplicación del genoma completo en lechuga. Nat. común 8, 14953 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Canción, C. et al. El genoma de Chrysanthemum nankingense proporciona información sobre la evolución y diversificación de las flores y los rasgos medicinales del crisantemo. mol. Planta 11, 1482–1491 (2018).

Artículo CAS PubMed Google Académico

Soltis, PS, Marchant, DB, Van de Peer, Y. & Soltis, DE Poliploidía y evolución del genoma en plantas. actual Opinión Gineta. desarrollo 35, 119–125 (2015).

Artículo CAS PubMed Google Académico

Soltis, PS & Soltis, DE Antiguos eventos de WGD como impulsores de innovaciones clave en angiospermas. actual Opinión Planta. Biol. 30, 159–165 (2016).

Artículo PubMed Google Académico

Soltis, DE et al. Poliploidía y diversificación de angiospermas. Soy. J.Bot. 96, 336–348 (2009).

Artículo PubMed Google Académico

Wang, Y. et al. MCScanX: un conjunto de herramientas para la detección y el análisis evolutivo de la colinealidad y sintenia génica. Ácidos Nucleicos Res. 40, e49 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Barker, MS et al. La mayoría de las compuestas (Asteraceae) son descendientes de un paleohexaploide y todas comparten un ancestro paleotetraploide con las Calyceraceae. Soy. J.Bot. 103, 1203–1211 (2016).

Artículo CAS PubMed Google Académico

Jiao, Y. et al. Una triplicación del genoma asociada con la diversificación temprana de las eudicots centrales. Genoma Biol. 13, R3 (2012).

Artículo PubMed PubMed Central Google Académico

Kumar, H. et al. Un análisis exhaustivo de quince genes de la ruta de biosíntesis de glicósidos de esteviol en Stevia rebaudiana (Bertoni). Gene 492, 276–284 (2012).

Artículo CAS PubMed Google Académico

Sapir-Mir, M. et al. La localización peroxisomal de las isomerasas de isopentenil difosfato de Arabidopsis sugiere que parte de la ruta del ácido mevalónico isoprenoide de la planta está compartimentada en peroxisomas. Fisiol vegetal. 148, 1219–1228 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, J., Li, S., Xiong, Z. & Wang, Y. Integración basada en minería de ruta de partes de enzimas críticas para la biosíntesis de novo del edulcorante de glicósidos de esteviol en Escherichia coli. Resolución celular 26, 258–261 (2016).

Artículo PubMed Google Académico

Nomura, T. et al. El análisis funcional de Arabidopsis CYP714A1 y CYP714A2 revela que son enzimas de modificación de giberelinas distintas. Fisiol de células vegetales. 54, 1837–1851 (2013).

Artículo CAS PubMed Google Académico

Tandel, KR Sustitutos del azúcar: controversia de salud sobre los beneficios percibidos. J. Pharmacol. Farmacéutico. 2, 236 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Swithers, SE Los edulcorantes artificiales producen el efecto contrario a la intuición de inducir trastornos metabólicos. Tendencias Endocrinol. metab. 24, 431–441 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

O'Neill, K. & Pirro, S. La secuencia completa del genoma de Stevia rebaudiana, the Sweetleaf. F1000Investigación. 9, 751 (2020).

Artículo PubMed PubMed Central Google Académico

Renny-Byfield, S. & Wendel, JF Doblando los genomas: poliploidía y plantas de cultivo. Soy. J.Bot. 101, 1711-1725 (2014).

Artículo PubMed Google Académico

Panchy, N., Lehti-Shiu, M. & Shiu, SH Evolución de la duplicación de genes en plantas. Fisiol vegetal. 171, 2294–2316 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Koren, S. et al. Canu: ensamblaje de lectura larga escalable y preciso a través de ponderación k-mer adaptativa y separación repetida. Genoma Res. 27, 722–736 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Chin, CS et al. Ensamblaje del genoma diploide en fases con secuenciación en tiempo real de una sola molécula. Nat. Métodos 13, 1050–1054 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Chakraborty, M., Baldwin-Brown, JG, Long, AD y Emerson, JJ Montaje de novo contiguo y preciso de genomas de metazoos con una modesta cobertura de lectura larga. Ácidos Nucleicos Res. 44, e147 (2016).

PubMed PubMed Central CAS Google Académico

Walker, BJ y col. Pilon: una herramienta integrada para la detección integral de variantes microbianas y la mejora del ensamblaje del genoma. PLoS ONE 9, e112963 (2014).

Artículo PubMed PubMed Central CAS Google Scholar

Li, H. & Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754–1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Parra, G., Bradnam, K. & Korf, I. CEGMA: una tubería para anotar con precisión genes centrales en genomas eucariotas. Bioinformática 23, 1061–1067 (2007).

Artículo CAS PubMed Google Académico

Belton, JM y col. Hi-C: una técnica integral para capturar la conformación de los genomas. Métodos 58, 268–276 (2012).

Artículo CAS PubMed Google Académico

Siervo, N. et al. HiC-Pro: una canalización optimizada y flexible para el procesamiento de datos Hi-C. Genoma Biol. 16, 259 (2015).

Artículo PubMed PubMed Central CAS Google Scholar

Edgar, RC & Myers, EW PILER: identificación y clasificación de repeticiones genómicas. Bioinformática 21, 152–158 (2005).

Artículo Google Académico

Price, AL, Jones, NC & Pevzner, PA Identificación de novo de familias repetidas en genomas grandes. Bioinformática 21, 351–358 (2005).

Artículo Google Académico

Xu, Z. & Wang, H. LTR_FINDER: una herramienta eficiente para la predicción de retrotransposones LTR de longitud completa. Ácidos Nucleicos Res. 35, W265–W268 (2007).

Artículo PubMed PubMed Central Google Académico

Mimbre, T. et al. Un sistema de clasificación unificado para elementos transponibles eucariotas. Nat. Rev. Genet. 8, 973–982 (2007).

Artículo CAS PubMed Google Académico

Tarailo-Graovac, M. & Chen, N. Uso de RepeatMasker para identificar elementos repetitivos en secuencias genómicas. actual Protocolo Bioinforma. 25, 4.10.1–4.10.14 (2009).

Artículo Google Académico

Jurka, J. et al. Repbase Update, una base de datos de elementos repetitivos eucariotas. Cytogenet Genoma Res. 110, 462–467 (2005).

Artículo CAS PubMed Google Académico

Stanke, M., Steinkamp, ​​R., Waack, S. y Morgenstern, B. AUGUSTUS: un servidor web para la búsqueda de genes en eucariotas. Ácidos Nucleicos Res. 32, W309–W312 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Majoros, WH, Pertea, M. & Salzberg, SL TigrScan y GlimmerHMM: dos buscadores de genes eucariotas ab initio de código abierto. Bioinformática 20, 2878–2879 (2004).

Artículo CAS PubMed Google Académico

Bromberg, Y. & Rost, B. SNAP: predecir el efecto de los polimorfismos no sinónimos en la función. Ácidos Nucleicos Res. 35, 3823–3835 (2007).

Artículo CAS PubMed PubMed Central Google Scholar

Blanco, E., Parra, G. & Guigó, R. Uso de geneid para identificar genes. actual Protocolo Bioinforma. 18, 4.3.1–4.3.28 (2007).

Artículo Google Académico

Altschul, SF et al. Herramienta básica de búsqueda de alineación local. J. Mol. Biol. 215, 403–410 (1990).

Artículo CAS PubMed Google Académico

Keilwagen, J. et al. Uso de la conservación de la posición del intrón para la predicción de genes basada en la homología. Ácidos Nucleicos Res. 44, e89 (2016).

Artículo PubMed PubMed Central CAS Google Scholar

Tang, S., Lomsadze, A. y Borodovsky, M. Identificación de regiones codificantes de proteínas en transcripciones de ARN. Ácidos Nucleicos Res. 43, e78 (2015).

Artículo PubMed PubMed Central CAS Google Scholar

Haas, BJ et al. Anotación automatizada de estructuras de genes eucarióticos utilizando EVidenceModeler y el programa para ensamblar alineaciones empalmadas. Genoma Biol. 9, R7 (2008).

Artículo PubMed PubMed Central CAS Google Scholar

Campbell, MA et al. Análisis completo de splicing alternativo en arroz y análisis comparativos con Arabidopsis. BMC Genomics 7, 327 (2006).

Artículo PubMed PubMed Central CAS Google Scholar

Boeckmann, B. et al. La base de conocimiento de proteínas SWISS-PROT y su suplemento TrEMBL en 2003. Nucleic Acids Res. 31, 365–370 (2003).

Artículo CAS PubMed PubMed Central Google Scholar

Conesa, A. et al. Blast2GO: una herramienta universal para la anotación, visualización y análisis en la investigación de la genómica funcional. Bioinformática 21, 3674–3676 (2005).

Artículo CAS PubMed Google Académico

Ashburner, M. et al. Ontología génica: herramienta para la unificación de la biología. El Consorcio de Ontología Genética. Nat. Gineta. 25, 25–29 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Kanehisa, M. & Goto, S. KEGG: enciclopedia de genes y genomas de Kyoto. Ácidos Nucleicos Res. 28, 27–30 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Li, L., Stoeckert, CJ & Roos, DS OrthoMCL: identificación de grupos ortólogos para genomas eucarióticos. Genoma Res. 13, 2178–2189 (2003).

Artículo CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM Software de alineación de secuencias múltiples MAFFT versión 7: mejoras en el rendimiento y la usabilidad. mol. Biol. Evol. 30, 772–780 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Castresana, J. Selección de bloques conservados de múltiples alineaciones para su uso en análisis filogenético. mol. Biol. Evol. 17, 540–552 (2000).

Artículo CAS PubMed Google Académico

Stamatakis, A. RAxML-VI-HPC: análisis filogenéticos basados ​​en la máxima verosimilitud con miles de taxones y modelos mixtos. Bioinformática 22, 2688–2690 (2006).

Artículo CAS PubMed Google Académico

Yang, Z. PAML 4: análisis filogenético por máxima verosimilitud. mol. Biol. Evol. 24, 1586-1591 (2007).

Artículo CAS PubMed Google Académico

De Bie, T. et al. CAFE: una herramienta computacional para el estudio de la evolución de la familia de genes. Bioinformática 22, 1269–1271 (2006).

Artículo CAS PubMed Google Académico

Chen, C. et al. TBtools: un kit de herramientas integrador desarrollado para análisis interactivos de grandes datos biológicos. mol. Planta 13, 1194–1202 (2020).

Artículo CAS PubMed Google Académico

Krzywinski, M. et al. Circos: una estética de la información para la genómica comparada. Genoma Res. 19, 1639–1645 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Descargar referencias

La investigación fue apoyada por la Fundación Nacional de Ciencias Naturales de China (31701497 y 31601371), la Fundación de Ciencias Naturales de la provincia de Jiangsu (BK20160600 y BK20180312) y el Laboratorio Clave de Jiangsu para la Investigación y Utilización de Recursos Vegetales (JSPKLB201801 y JSPKLB201832).

Estos autores contribuyeron por igual: Xiaoyang Xu, Haiyan Yuan

Instituto de Botánica, Provincia de Jiangsu y Academia China de Ciencias/Plataforma Provincial de Jiangsu para la Conservación y Utilización de Germoplasma Agrícola, Nanjing, 210014, Jiangsu, China

Xiaoyang Xu, Haiyan Yuan, Suzhen Huang, Yuming Sun, Ting Zhang, Qingquan Liu, Haiying Tong, Yongxia Zhang, Yinjie Wang, Menglan Hou y Yongheng Yang

Facultad de Horticultura, Universidad Agrícola de Nanjing, Nanjing, 210095, Jiangsu, China

Xiaqing Yu

Instituto de Pomología, Academia de Ciencias Agrícolas de Jiangsu/Laboratorio clave de Jiangsu para la mejora genética de cultivos hortícolas, Nanjing, 210014, Jiangsu, China

Chunxiao Liu

Corporación de tecnologías de biomarcadores, Pekín, 101300, China

leiwu

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

XX, YY y HY concibieron el estudio; Muestras recolectadas de HT, YW e YZ; LW y XX realizaron la secuenciación del genoma; XX, XY, SH, YS, CL, TZ, QL y MH realizaron los análisis de datos; XX y HY escribieron el manuscrito; y YY revisó el manuscrito. Todos los autores leyeron y aprobaron el manuscrito final.

Correspondencia a Yongheng Yang.

Los autores declaran no tener conflictos de intereses.

Figuras complementarias 1-8 Nuestro artículo solo contiene dos archivos complementarios, Tablas complementarias 1-11 y Figuras complementarias 1-8. Elimine los archivos complementarios duplicados, gracias.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Xu, X., Yuan, H., Yu, X. et al. El genoma de Stevia a nivel cromosómico proporciona información sobre la biosíntesis de glucósidos de esteviol. Hortic Res 8, 129 (2021). https://doi.org/10.1038/s41438-021-00565-4

Descargar cita

Recibido: 23 noviembre 2020

Revisado: 07 de marzo de 2021

Aceptado: 14 de marzo de 2021

Publicado: 01 junio 2021

DOI: https://doi.org/10.1038/s41438-021-00565-4

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Biología vegetal BMC (2023)

Recursos genéticos y evolución de cultivos (2023)

Cultivo de células, tejidos y órganos vegetales (PCTOC) (2022)