Tensorboard
Les statsss !
Tensorboard est une série de graphiques qui nous permettent de suivre la progression de notre modèle pendant l’entraînement, mais il y a de nombreux graphiques. Nous nous intéressons uniquement au graphique appelé ‘g/total’. Vous pouvez le trouver en cliquant sur ‘inactif’ et en sélectionnant ‘scalaires’. Ensuite, allez à la dernière page, où vous le trouverez dans le dernier graphique.
Ouverture de TensorBoard
Ouvrez TensorBoard en exécutant la commande suivante dans votre terminal ou utilisez le fichier run-tensorboard.bat
:
Remplacez “chemin/vers/vos/logs” par le chemin réel vers vos logs TensorBoard.
Accès à TensorBoard
Une fois TensorBoard lancé, ouvrez votre navigateur web et naviguez jusqu’à http://localhost:6006
(ou l’adresse indiquée dans votre terminal).
Navigation dans TensorBoard
Cliquez sur l’onglet “Scalars” dans TensorBoard. Recherchez la métrique “g/total” en haut pour suivre la progression de votre formation.
Paramètres
- Réglez le lissage à 0,950 ou 0,987 pour une meilleure visualisation du graphique.
- Vous pouvez cliquer sur l’icône :gear: pour marquer l’option de recharger les données toutes les 30 secondes.
- Sous chaque graphique, il y aura 3 boutons. Le premier est pour mettre en pleine taille, le deuxième pour désactiver l’axe Y et le dernier pour ajuster les données au graphique.
- Décochez l’option pour ignorer les valeurs aberrantes dans l’échelle du graphique.
Point le plus bas
C’est lorsque le graphique atteint un point si bas qu’il ne se reproduit plus. Pendant l’entraînement, il y aura plusieurs points bas que vous devriez tester pour trouver le pth indiqué de votre modèle et ainsi éviter que notre modèle soit sur-entraîné. Pour savoir lequel choisir, nous allons au point le plus bas et regardons combien de pas il a. Sachant cela, nous pouvons chercher dans la cmd ouverte ou le notebook colab les époques avec ce pas ou le plus proche des points de sauvegarde.
Outre le contrôle du loss/g/total, il est nécessaire de surveiller les graphiques loss/g/mel, loss/g/kl et loss/d/total. Si l’une de ces valeurs augmente et ne diminue plus, cela indique un sur-entraînement.