Argentina es el primer exportador de harinas de soja (FAO). A nivel industrial, el cultivo de soja tiene relevancia económica por ser una importante fuente de aceite y proteína. Desde 1980 a la actualidad se observó un aumento continuo en el rendimiento de las variedades liberadas al mercado y una disminución de la concentración de proteína en grano (De Felipe, 2016). La industria argentina ha tenido dificultades para producir harinas que cumplan con los estándares mínimos de comercialización (HI-PRO o alta proteína con un tenor proteico mínimo de 46,5%). Esto se atribuye al bajo tenor proteico de los granos de soja producidos.
Existen combinaciones de concentración de aceite y proteína en los granos que posibilitan lograr harinas con un mínimo de proteína de 46,5%. Pero en campañas agrícolas recientes, dichas combinaciones sólo fueron logradas en situaciones puntuales. Esto puede ser atribuido a varios factores. La concentración de proteína en grano depende de variables de manejo agronómico, por ejemplo, elección de cultivar y fecha de siembra, como así también, de variables ambientales como temperatura o disponibilidad hídrica (Mourtzinis et al, 2017; Rotundo et al., 2009).
El análisis de bases de datos provistas por productores permite obtener información de alta calidad. Actualmente, las técnicas de minería de datos se aplican con mayor frecuencia en estudios de investigación (Liao et al., 2012). Una de las técnicas más reconocidas es el modelado de árboles de clasificación y regresión (Breiman et al., 1984). Este enfoque es apropiado para estudiar posibles variables determinantes de la concentración de proteína en soja según datos de productores a escala regional (De’Ath y Fabricius, 2000). Por otro lado, es posible analizar la variación en la composición de los granos de soja teniendo en cuenta patrones espaciales. Este tipo de análisis permite explorar la variabilidad a menor escala en una extensa zona productiva, como lo es la zona centro-norte de la Argentina (Rotundo et al., 2016).
Actualmente, se desconocen los límites precisos de los patrones zonales en la Argentina en lo referente a concentración de proteína. Esto permitiría identificar zonas que consistentemente presenten altos tenores proteicos. Por otro lado, no se han utilizado datos de producción para determinar cómo el manejo particular de cada lote influye en la calidad del grano de soja. El objetivo del presente trabajo fue: caracterizar zonas de producción de la Argentina según la concentración proteica de la soja allí producida e identificar variables de manejo que permitan aumentar la concentración de proteína en grano.
Materiales y métodos
Los datos analizados corresponden a empresas CREA. Se tuvieron en cuenta tanto lotes de producción (n=1721), como también redes de ensayos que llevan adelante los integrantes de CREA (n=954). Las bases de datos comprenden observaciones entre las campañas 2012/13 y 2015/16 y fueron divididas en soja de primera y de segunda.
El procedimiento de toma de muestras de grano fue gestionado por la Facultad de Ciencias Agrarias de la Universidad Nacional de Rosario (UNR). En cada campaña se enviaron a cada productor CREA bolsas para el muestreo de granos a cosecha. Junto con la muestra, los productores proporcionaban datos de latitud y longitud del lote, rendimiento y el manejo agronómico realizado en el mismo. Cada muestra fue analizada mediante espectroscopia de infra-rojo cercano de reflectancia (NIR 5000, FOSS, Dinamarca), para estimar concentración de proteína y aceite en grano (porcentaje base seca). Dentro de las variables de manejo agronómico, se consideró genotipo, grupo de madurez, fecha de siembra, cultivo antecesor, distanciamiento entre hileras, inoculación, fertilización y aplicación de fungicida. Paralelamente, se estimaron los datos climáticos utilizando información de INTA. Se tuvieron en cuenta latitud, longitud, precipitación y radiación acumuladas, y temperaturas medias para cada mes del ciclo del cultivo (octubre-marzo) en cada una de las observaciones. El análisis se realizó en forma separada para lotes de producción y ensayos comparativos de rendimiento.
En las muestras provenientes de lotes de producción se consideró un enfoque geostadístico para mapear la variabilidad en concentración de proteína de los lotes correspondientes a la zona estudiada. Se utilizó el método de interpolación por Krigging, que parte del supuesto que puntos próximos en el espacio tienden a tener valores de proteína en grano similares en comparación con puntos más distantes. Se realizaron variogramas que permiten explorar el grado de asociación espacial entre lotes para luego representar dichas asociaciones en un mapa de la zona bajo estudio.
Para detectar qué variables ambientales y de manejo influyen en la calidad de los granos, se utilizó el modelado mediante árboles de regresión. Los árboles de regresión son técnicas de partición recursiva que permiten ir separando la variabilidad total de los datos de en grupos más homogéneos.
En los muestras provenientes de ensayos comparativos de rendimiento, para desglosar el efecto del genotipo, del ambiente y su interacción sobre la concentración de proteína, se optó por analizar los datos mediante modelos mixtos. A su vez, para predecir el verdadero efecto genotípico de cada cultivar en particular, independientemente de los efectos ambientales, el uso de los mejores predictores lineales no sesgados (BLUP, por su sigla en inglés) proporcionó una estimación adecuada del efecto cultivar en diferentes ambientes, lo cual permitió identificar genotipos que presentan consistentemente altos valores proteicos. Los BLUPs de cada cultivar se obtuvieron usando estimaciones en un modelo que incluyó ambiente, genotipo e interacción genotipo por ambiente.
Resultados
En la evaluacion realizada con muestras de lotes de producción, el variograma indicó una fuerte auto-correlación espacial para concentración de proteína en soja de primera. No hubo auto-correlación espacial en soja de segunda. La variación espacial de concentración de proteína para soja de primera se predijo usando Krigging ordinario. El mapa predicho indicó zonas con baja concentración de proteína (<35%) y zonas bien definidas con altos valores de proteína en grano (>38%). Se pudo observar un claro gradiente norte-sur para la variable analizada. En cuanto a soja de segunda, al no haber encontrado un patrón espacial determinado, no fue posible realizar un mapa que refleje algún tipo de asociación entre concentración de proteína y ubicación del lote. Vale mencionar que no encontrar asociación espacial no implica que no haya variabilidad en los valores de proteína entre localidades.
Los árboles de regresión explicaron aproximadamente el 50% de la variabilidad total observada para soja de primera y soja de segunda. El criterio de división primario fue genotipo, identificando dos grupos que difieren en dos puntos en niveles de proteína en grano. Para genotipos con valores cercanos a 36% de proteína promedio, las condiciones térmicas durante el mes de diciembre fueron importantes; observando mayores valores proteicos ante mayores temperaturas en dicho mes. En este grupo de obervaciones, grupos de madurez III mostraron menores valores respecto a grupos más largos. Por otra parte, genotipos con mayores valores de proteína (~38%), su magnitud está dada en base a la longitud del lote dónde son cultivados. En resumen, las variables de manejo explicaron un 73% de las variaciones observadas en concentración de proteína para soja de primera.
Para genotipos con menores valores de proteína promedio, las condiciones ambientales durante el mes de enero fueron determinates. En líneas generales, mayor disponibilidad hídrica y temperaturas medias disminuyen la concentración de proteína, observando mayores valores proteicos ante menores temperaturas en dicho mes. Contrariamente, ante escasas precipitaciones en el mes de enero, genotipos de alto potencial sembrados tardíamente (luego del 10 de diciembre) manifestaron altos valores de proteína en grano. Paralelamente, el valor proteico de los granos de ciertos genotipos dependieron de las precipitaciones totales de la campaña. Condiciones hídricas más restrictivas presentaron más proteína en grano que la siembre en los mejores ambientes. Finalmente, las variables de manejo explicaron un 71% de las variaciones observadas en concentración de proteína para soja de segunda.
Factores ambientales y de manejo que explican la variabilidad de proteína en soja en el centro de la Argentina.pdf