El equipo responsable del logro está formado por 18 instituciones, incluyendo al Instituto Conjunto del Genoma del Departamento de Energía de Estados Unidos (DOE JGI), el Servicio de Investigaciones Agrícolas del Departamento de Agricultura de Estados Unidos (ARS-USDA) y las Universidades Purdue y de Carolina del Norte en Charlotte.
El trabajo fue financiado por el Departamento de Energía, la Fundación Nacional para las Ciencias, el Departamento de Agricultura y la asociación United Soybean Board, que agrupa a los productores de soja de Estados Unidos.
«El genoma de la soja nos permite entender mejor cómo la planta transforma la luz solar, el dióxido de carbono, el nitrógeno y el agua en energía, proteínas y otros nutrientes para los humanos y los animales,» señaló Anna Palmisano, Directora Asociada del DOE. «Esto abre la puerta al mejoramiento del cultivo, tan necesario para la producción de energía, la producción sustentable de alimentos, y el balance ambiental saludable de la actividad agrícola».
Con el genoma secuenciado, la comunidad científica tiene hoy el acceso también a la información de más de 20.000 especies de legumbres y puede explorar la innovación evolutiva extraordinaria que representa la fijación simbiótica del nitrógeno, tan crítica e importante para el éxito de las estrategias de rotación de cultivos agrícolas.
Jeremy Schmutz, primer autor del estudio, explicó que la secuenciación del genoma de la soja fue el proyecto de plantas más grande hasta ahora realizado por el DOE JGI. «También es el genoma vegetal más grande secuenciado con la estrategia de shotgun-en el que se generan pedazos de secuencias que se ensamblan luego como si fueran piezas de un rompecabezas,» señaló Schmutz. De los 20 genomas vegetales a cargo del DOE JGI, los ya secuenciados incluyen al álamo y al sorgo granífero, ambos considerados por su capacidad de servir como fuente de biomasa para la producción de biocombustibles.
Gary Stacey, co-autor del trabajo, contó que el análisis de la secuencia reveló más de 46.000 genes de los cuales 1.110 están involucrados en el metabolismo de lípidos. «Estos genes y sus vías asociadas son la base que determina el contenido de aceite, y son por lo tanto buenos blancos para la modificación, pensando en un mejor aprovechamiento de la soja en la producción de biodiesel.» Según los científicos, «combinando la informática con la bioquímica y la genética podremos desarrollar una soja con más del 40% de aceite».
La disponibilidad de la secuencia del genoma de la soja ya ha contribuido a acelerar el desarrollo de variedades con nuevas características, como por ejemplo, para apuntar a una mutación que puede ser usada para seleccionar variedades con niveles bajos de estaquiosa, mejorando la digestibilidad de la soja.
También, comparando los genomas de la soja y del maíz, encontraron una mutación puntual que causa una reducción en la producción de fitato en la soja, la forma en que los tejidos de la planta almacenan el fósforo. Como el fitato no es absorbido por los animales, pasa a través del tracto grastrointestinal, acumulándose grandes cantidades de fósforo en el estiércol. Disminuyendo la cantidad de fitato en la soja se podría reducir la contaminación ambiental causada por el estiércol de aves y cerdos.
Especialmente importante para los agricultores, la secuencia del genoma ha permitido el acceso al primer gen de resistencia a la roya de la soja, una enfermedad fúngica del cultivo que causa enormes pérdidas todos los años.