L’IA pour prédire l’évolution des marchés ?

sparkling ai

L’IA pour prédire l’évolution des marchés financiers : Des chercheurs de l’université d’Oxford ont mis au point en partenariat avec Man Group un programme d’apprentissage automatique capable de prédire le cours des actions. Les chercheurs affichent un taux de réussite de 80 % sur une période de 30 secondes de trading en direct. Gautier Soubrane, directeur Commercial – Europe de l’Ouest, Moyen Orient et Afrique chez Graphcore nous explique comment.

Prédire l’évolution du prix des actions est un rêve.

À ce jour, les prédictions les plus performantes portent sur une évolution à 1 ou 2 millisecondes — ce qui est peu. Les travaux des chercheurs de l’Oxford-Man Institute of Quantitative Finance pourraient changer la donne. En utilisant des approches fondées sur le traitement du langage naturel et des processeurs IPU (Intelligence Processing Unit), l’équipe de chercheurs à largement réduit le temps d’entraînement des modèles de prévisions multihorizon pour prédire l’évolution des marchés.

Lire également La personnalisation des prix grâce à l’IA

Les carnets d’ordre : source de données

Pour entraîner leur modèle, les chercheurs puisent dans le carnet d’ordre à cours limité qui recense tous les ordres d’achat à un instant T, soit plusieurs millions d’ordres comportant chacun des informations sur le prix d’achat et de vente ainsi qu’un marqueur temporel (timestamp) pour l’exécution. En passant au tamis algorithmique ce carnet de liquidité, il est alors possible de déterminer une trajectoire pour des mouvements du marché dans un sens ou dans l’autre et surtout le moment décisif pour réaliser une opération.

Passer d’un seul horizon à un horizon multiple

Pour gagner en précision, l’équipe d’Oxford a mis en œuvre une analyse multihorizon, là où ce type d’analyse par l’IA a jusqu’alors recouru à une prévision mono horizon pour corréler les prix des ordres et les prix du marché dans une fenêtre temporelle définie et surtout unique. En effet, l’apprentissage supervisé monohorizon est limité par la multitude de facteurs à prendre en compte et le rapport signal/bruit pour obtenir une prévision fiable. À l’inverse, la prévision multihorizon étudie les mouvements de prix sur une série d’intervalles, les résultats de chaque horizon informant le suivant. En agrégeant ces fenêtres, les prévisions portent ainsi sur un temps plus long.

Le NLP au secours du multihorizon

Pour développer cette approche multihorizon, l’équipe de chercheurs s’est inspirée du traitement en langage naturel en ayant recours aux modèles Seq2seq et Attention fondés sur des couches neuronales récurrentes complexes comprenant un encodeur et un décodeur. L’encodeur Seq2Seq résume les informations des séries temporelles passées et le décodeur combine les états cachés avec les entrées futures connues pour générer des prédictions. Le modèle Attention permet pour sa part de remédier aux limitations des modèles Seq2Seq adaptés au traitement de séquences courtes.

Stefan Zohren, chercheur à l’Oxford-Man Institute (OMI) souligne que ce modèle peut être comparé à un programme qui traduit une phrase de l’anglais au français en construisant des inférences de manière incrémentielle.

Nous avons effectué des tests comparatifs avec un large éventail de réseaux de pointe intéressants et nous avons constaté que les IPU sont au moins plusieurs fois plus rapides que les GPU courants. Pour donner un chiffre, je pense que c’est au moins 10 fois plus rapide.

Dr. Zhang

Un gain de plus de 30 secondes sur les prédictions

De fait, les données du carnet d’ordre à cours limité (LOB – limit order book) ont été utilisées pour entraîner un certain nombre de modèles sur l’IPU, dont un — DeepLOB — développé par la même équipe de l’OMI (Zhang et al, 2019). En termes de prévision multihorizon, les chercheurs ont testé deux variantes de DeepLOB, nommées DeepLOB-Seq2Seq, et DeepLOB-Attention, qui utilisent respectivement des modèles Seq2Seq et Attention comme décodeurs.

Ces nouveaux modèles ont fourni une précision de prédiction supérieure à la fois à des horizons plus courts, tels que K=10, et, surtout, à des horizons plus longs, tels que K=50 et K=100. Dans ce cas, K représente le « tick time », l’heure à laquelle les messages sont reçus à la bourse. Il s’agit d’un temps naturel qui tique plus rapidement pour les actions plus liquides et plus lentement pour les actions moins liquides.

Pour le dire autrement, l’algorithme a réussi à déterminer la direction de prix sur une période de 100 ticks, soit environ une prédiction pouvant aller de 30 secondes à 2 minutes selon les conditions du marché ! Au regard de ces premiers résultats, le Dr. Zohren est très optimiste pour la suite :

Les algorithmes d’apprentissage par renforcement constituent un excellent cadre pour appliquer ces prévisions multihorizons dans un contexte d’exécution optimale ou de tenue de marché. Étant donné la complexité de calcul de ces algorithmes, les gains de vitesse obtenus avec les IPU pourraient même être plus importants dans cette configuration.