Un datalake pour améliorer les rendements des semences

Un datalake pour améliorer les rendements des semences

Comment RAGT un des plus grands semenciers européen, a utilisé les big data pour accélérer la mise sur le marché de ses nouvelles semences

Le défi de la transformation numérique

Le groupe  RAGT, acronyme de Rouergue Auvergne Gévaudan Tarnais est un semencier européen (350M€ de chiffre d’affaires en 2019) dont la mission est de développer, tester, produire et commercialiser des semences (blé colza, mais, orge…). La moitié des pâtes en France sont issues de céréales RAGT. Afin de rester compétitif, RAGT doit en permanence lancer de nouvelles variétés. Mais le temps de déposer une nouvelle semence dans le  catalogue officiel français des espèces et variétés de plantes peut prendre de 3 à 7 ans. RAGT cherchait donc une solution pour réduire ce temps et être présent sur le marché beaucoup plus rapidement.

Le pôle R&D de RAGT souhaitait se doter des outils permettant de mieux analyser et mieux exploiter la multitude des données en sa possession. Celles-ci consistent notamment dans le génotypage des espèces avec en moyenne 30 000 marqueurs , du marquage moléculaire, des relevés sur les parcelles de tests, ainsi que des données publiques sur le génome standard.

Comment JEMS a développé une vision 360° pour RAGT

Les défis étaient nombreux entre la dette technique contractée avec la mise en place d’un datawarehouse « maison », l’unification des processus métier ou l’intégration d’une énorme volumétrie de données. JEMS a donc travaillé avec le pôle R&D de manière itérative en proposant une plateforme centralisée et unifiée pour faciliter l’accès et simplifier la lecture des données. En optimisant les processus métier avec une vision 360° autour de la variété de céréales et en mettant en place une stratégie de gouvernance forte, RAGT a pu améliorer la qualité de ses semences et réduire de 2 ans la mise sur le marché.

Technologies

spark talend

En résumé

  1. Mise en place du datalake sur site avec une organisation des données en couches;
  2. Agrégation de nouveaux types de données (météo, images de drones);
  3. Création d’un algorithme de machine learning pour l’estimation du rendement des cultures.

Bénéfices

Vous ne savez pas par où commencer?

Découvrez l'offre qui correspond à vos besoins…

Découvrir

Centre de préférences de confidentialité