Generative Adversarial Network pour la génération de données financières

Projet de Statistiques Appliquées, ENSAE 2023/2024

Génération de données financières

Dans le cadre du développement, de l'estimation ou de l'utilisation de modèles, les données financières servent de support au modèle. On cherche ainsi à déduire des propriétés à partir d'un état du monde observé. On suppose donc que les réalisations d'une série observée sont les résultats d'un phénomène stochastique. Les méthodes statistiques usuelles supposent que les variations d'un actif financier (par exemple), suivent une certaine loi, dont on peut estimer les paramètres. A partir de ces estimations, on peut ensuite simuler et quantifier différentes réalisations de la série. Cette approche statistique nécessite de faire un certain nombre d'hypothèse sur la série observée, qui ne sont pas toujours vérifiée. Les méthodes de Machine Learning se caractérisent par des hypothèses moins fortes et une approche plus empiriste.

Les modèles GAN

Les modèles GAN sont des modèles de génération de données. Ces derniers se sont inscrits dans le paysage de l'IA grâce à leurs performances, particulièrement sur la génération d'images (cf https://thispersondoesnotexist.com/ qui génère des visages). L'avantage de la génération d'images est qu'il est "facile" de vérifier les performances du modèles. Il est plus compliqué de voir si une donnée tabulaire ou une série financière est vraisemblable. L'enjeu du projet n'est donc pas seulement de mettre en place un modèle qui peut imiter une série numérique, mais aussi de pouvoir quantifier les résultats.

Se référer au fichier Rapport.pdf pour voir les résultats détaillés

Enjeux du projet

Ainsi, le but de ce projet est, à partir des résultats existants de la littérature, de tester l’utilisation d’algorithme GAN afin d'apprendre sur des données de marchés et de génerer des scénarios futures possibles qui peuvent être utiles à exploiter selon le contexte. L'objectif principal est donc de tester différents types et catégories d'algorithmes GAN afin de tirer le potentiel exploitable pour notre problématique et aussi les limites. Une des finalités intéressantes serait également d'observer la plus-value de cette méthode par rapport aux méthodes stochastiques décrites plus haut.

Start

Depuis un terminal, effectuer les commandes suivantes :

Assurez-vous d'avoir Python installé.
Clonez ce dépôt (cf: Guide pour cloner un dépot).
Accédez au répertoire du projet via le terminal.

Après avoir créé un environnement virtuel (cf: Guide création environnement virtuel sur vs code) installer les packages nécessaires avec:

pip install -r requirements.txt

Les notebooks

presentation_gan: présente une introduction générale au GAN en présentant un GAN de génération d'image développé avec PyTorch.
gan_cnn: présente une première utilisation de modèle GAN pour la génération de données temporelles. Le modèle utilisé est un W-GAN avec un réseau de neurone convolutif. Le générateur est conditionnel, c'est à dire qu'il fut entraîné à prendre en entrée le début d'une série pour en déduire les n valeurs suivantes. (Le notebook est encore "brouillon", simplement quelques résultats sont présentées. #TODO: Présentation du notebook)
gan_lstm: implémentation du modèle Quant-Gan.
quant_gan: Le modèle est pareil en tout point du modèle de gan_simulation, mais l'architecture du modèle (générateur et discriminateur) est un LSTM (Long Short Term Memory).
TimeGAN: Implémentation du papier TimeGan avec TensorFlow /!\ Pour faire tourner le notebook, télécharger les packages de requirements2 /!\

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
data		data
img		img
logs		logs
model		model
utils		utils
README.md		README.md
Rapport.pdf		Rapport.pdf
TimeGAN.ipynb		TimeGAN.ipynb
basic gan.ipynb		basic gan.ipynb
evaluating_synthetic_data.ipynb		evaluating_synthetic_data.ipynb
first_gan.ipynb		first_gan.ipynb
gan_cnn.ipynb		gan_cnn.ipynb
gan_lstm.ipynb		gan_lstm.ipynb
get_gen_scenarios.ipynb		get_gen_scenarios.ipynb
presentation_données_new.ipynb		presentation_données_new.ipynb
qqplot.png		qqplot.png
quant_gan.ipynb		quant_gan.ipynb
requirements.txt		requirements.txt
requirements2.txt		requirements2.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Generative Adversarial Network pour la génération de données financières

Génération de données financières

Les modèles GAN

Enjeux du projet

Start

Les notebooks

Quelques résultats

About

Releases

Packages

Contributors 2

Languages

QMoayedpour/statapp-hsbc

Folders and files

Latest commit

History

Repository files navigation

Generative Adversarial Network pour la génération de données financières

Génération de données financières

Les modèles GAN

Enjeux du projet

Start

Les notebooks

Quelques résultats

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages