Les micro-ARNs (miARNs) jouent un rôle essentiel dans de nombreux processus physiologiques. Leurs dérégulations sont liées au développement et à la progression
de diverses maladies humaines, dont les cancers. L'identification de nouveaux miARNs associés à des maladies contribue à une meilleure compréhension des mécanismes de
pathogénicité. Les miARNs représentent également une formidable opportunité en biotechnologie pour le diagnostic précoce et la thérapie génique.
Cependant aujourd'hui les données accumulées sur le sujet sont faibles. Pour maximiser les chances de succés en laboratoire, le recours à la modélisation mathématique
doit être privilégié de manière à estimer le probabilité d'un lien entre un miARN et une maladie sachant les données acquises. Parmis les stratégies disponibles, nous avons
opté pour la méthode de sémantique distributive qui présente de nombreux avantages dans la cadre de cette application. Cette méthode est principalement utilisée par les
moteurs de recherche sur Internet pour renvoyer une liste de pages web sachant une liste de mots clefs.
L'objectif du programme est d'améliorer la méthodologie et de proposer de nouvelles prédictions à tester en laboratoire. Un algorithme évolutionnaire basé sur les librairies
de Hold-Geoffroy et Garreth sera utilisé pour maximiser le choix des paramètres.