Big Data in Finance

L’objectif de ce projet est de trouver une corrélation entre des données exogènes et le cours d’une monnaie électronique, le Bitcoin.

Devant l’augmentation exponentielle du volume de données disponibles sur internet, extraire et interpréter les données issues du « Big data » représente un des principaux enjeux informatiques pour les années à venir dans plusieurs domaines, tels que la médecine, les médias, l’énergie et la finance.

En effet, de nombreuses méthodes ont été mises au point et sont utilisées pour tenter de comprendre et d’anticiper les tendances d’un ou de plusieurs marchés. Néanmoins, il semble encore impossible de prédire de manière tout à fait exacte une tendance financière. Même les méthodes les plus utilisées, comme l’analyse technique, trouvent des détracteurs.

L’objectif de notre projet est de trouver une corrélation entre des données exogènes (données qui ne sont pas directement corrélées avec une autre) et le cours d’une monnaie électronique, le Bitcoin, afin de mettre au point un modèle qui permettra de retracer la courbe du Bitcoin en fonction de ces données et ainsi confirmer notre analyse préliminaire qui tend à montrer que ces données ont un impact sur le cours du Bitcoin.

La diversité des données disponibles est une véritable opportunité pour le secteur financier. En effet, le comportement des marchés financiers étant corrélé à des facteurs macro-économiques, il est possible de prendre en compte un très grand nombre d’évènements et d’étudier l’influence qu’ils ont eue sur un cours donné dans le but de mettre au point un modèle prédictif. Ces évènements peuvent être très variés, allant par exemple d’une décision d’une banque centrale au hacking informatique d’un important site de ventes en ligne.

Ainsi de nombreuses banques d’investissements possèdent désormais des services composés de « Data Scientists » qui vont avoir pour objectif d’extraire des données et créer des algorithmes dans le but de créer des modèles prédictifs.

Pour cela, l’informatisation généralisée des marchés financiers va leur permettre d’avoir à leur disposition de nombreux outils pour effectuer les différentes tâches d’extraction de données, de statistiques et de machine learning. Parmi ces outils on peut citer le framework java « Hadoop » qui permet de traiter un volume très important de données.

Notre démarche a consisté à s’intéresser au comportement des utilisateurs de cette monnaie. L’intérêt du Bitcoin réside dans son économie assez fermée, et moins sujette aux évènements macro-économiques. De plus, si un modèle est opérationnel sur le Bitcoin, alors il serait intéressant de le tester sur l’économie globale pour voir si le comportement des utilisateurs du Bitcoin s’y retrouve. Pour cela, nous avons récupéré plusieurs données, comme par exemple, le nombre de visites sur la page Wikipédia consacrée au Bitcoin, ou le nombre de recherches sur le web. Par la suite, nous avons mis au point un modèle à partir d’un arbre de décision qui va réunir ces données exogènes et s’étalonner sur la courbe réelle du cours du Bitcoin. Une fois ce modèle implémenté, nous avons reconstruit le cours du Bitcoin en utilisant uniquement des données exogènes, ce qui nous a permis de constater un lien entre le cours de cette monnaie et le comportement de ses utilisateurs.

Ajouter un commentaire

CAPTCHA
Ce test a pour but d'empêcher les spams.
12 + 3 =
Trouvez la solution de ce problème mathématique simple et saisissez le résultat. Par exemple, pour 1 + 3, saisissez 4.