Important ! La formation est uniquement pour les GPU NVIDIA. Si vous n’avez pas de GPU compatible, l’onglet Formation sera désactivé.

Comment utiliser le Tensorboard pour une formation correcte ? Consultez la section Tensorboard.

1

Étape 1 : Préparation des données

  1. Téléchargez votre audio au format .wav en utilisant le Créateur de jeux de données ou configurez-le manuellement dans applio/assets/datasets en créant un dossier pour que le programme puisse le lire.
2

Étape 2 : Traitement des données

  1. Une fois le modèle nommé et le jeu de données sélectionné, appuyez sur “Prétraiter le jeu de données” et attendez le message dans le CMD.

Assurez-vous que votre jeu de données consiste en un seul fichier audio ou, si vous le divisez, assurez-vous que chaque segment audio a une durée de 10 à 15 secondes par audio.

3

Étape 3 : Extraction des caractéristiques

  1. Sélectionnez une méthode F0 qui convient à vos besoins.
  2. (optionnel) modifiez la longueur de saut, une valeur plus basse, une plus grande douceur du changement de ton mais un entraînement plus lent et vice versa.
4

Étape 4 : Formation du modèle

Configurez les paramètres de formation selon vos besoins.

  • Sauvegardez chaque époque : Réglez cette valeur entre 10 et 50 pour déterminer la fréquence à laquelle l’état du modèle est sauvegardé pendant la formation.
  • Époques totales : Le nombre d’époques nécessaires varie en fonction de votre jeu de données. Surveillez les progrès en utilisant TensorBoard ; généralement, les modèles fonctionnent bien autour de 200-400 époques.
  • Taille du lot : Ajustez en fonction de la VRAM de votre GPU. Pour 8 Go de VRAM, utilisez une taille de lot entre 6 et 8. Considérez les cœurs CUDA lors de l’expérimentation avec des tailles de lot plus élevées.
5

Étape finale : Sauvegarde du modèle et génération du fichier d'index

  1. Une fois la formation terminée, générez le fichier d’index en cliquant sur le bouton “Train Feature Index”.

Vous pouvez maintenant exporter votre modèle formé directement depuis l’interface Applio, allez dans la section Export Model dans l’onglet train, cliquez sur le bouton Refresh et sélectionnez le pth et l’index ajouté du modèle à exporter.

  • (Si vous souhaitez vous réentraîner, entrez le même nom de modèle et localisez à quelle étape les fichiers de sauvegarde sont laissés, entrez un nombre plus élevé d’epoch.)
  • Votre modèle formé se trouve dans le dossier logs/model, et les fichiers .pth sont dans le dossier logs/zips.
  • Si vous n’avez pas de GPU NVIDIA, vous pouvez essayer Applio Colab. Consultez la section des alternatives.

Important ! La formation est uniquement pour les GPU NVIDIA. Si vous n’avez pas de GPU compatible, l’onglet Formation sera désactivé.

Comment utiliser le Tensorboard pour une formation correcte ? Consultez la section Tensorboard.

1

Étape 1 : Préparation des données

  1. Téléchargez votre audio au format .wav en utilisant le Créateur de jeux de données ou configurez-le manuellement dans applio/assets/datasets en créant un dossier pour que le programme puisse le lire.
2

Étape 2 : Traitement des données

  1. Une fois le modèle nommé et le jeu de données sélectionné, appuyez sur “Prétraiter le jeu de données” et attendez le message dans le CMD.

Assurez-vous que votre jeu de données consiste en un seul fichier audio ou, si vous le divisez, assurez-vous que chaque segment audio a une durée de 10 à 15 secondes par audio.

3

Étape 3 : Extraction des caractéristiques

  1. Sélectionnez une méthode F0 qui convient à vos besoins.
  2. (optionnel) modifiez la longueur de saut, une valeur plus basse, une plus grande douceur du changement de ton mais un entraînement plus lent et vice versa.
4

Étape 4 : Formation du modèle

Configurez les paramètres de formation selon vos besoins.

  • Sauvegardez chaque époque : Réglez cette valeur entre 10 et 50 pour déterminer la fréquence à laquelle l’état du modèle est sauvegardé pendant la formation.
  • Époques totales : Le nombre d’époques nécessaires varie en fonction de votre jeu de données. Surveillez les progrès en utilisant TensorBoard ; généralement, les modèles fonctionnent bien autour de 200-400 époques.
  • Taille du lot : Ajustez en fonction de la VRAM de votre GPU. Pour 8 Go de VRAM, utilisez une taille de lot entre 6 et 8. Considérez les cœurs CUDA lors de l’expérimentation avec des tailles de lot plus élevées.
5

Étape finale : Sauvegarde du modèle et génération du fichier d'index

  1. Une fois la formation terminée, générez le fichier d’index en cliquant sur le bouton “Train Feature Index”.

Vous pouvez maintenant exporter votre modèle formé directement depuis l’interface Applio, allez dans la section Export Model dans l’onglet train, cliquez sur le bouton Refresh et sélectionnez le pth et l’index ajouté du modèle à exporter.

  • (Si vous souhaitez vous réentraîner, entrez le même nom de modèle et localisez à quelle étape les fichiers de sauvegarde sont laissés, entrez un nombre plus élevé d’epoch.)
  • Votre modèle formé se trouve dans le dossier logs/model, et les fichiers .pth sont dans le dossier logs/zips.
  • Si vous n’avez pas de GPU NVIDIA, vous pouvez essayer Applio Colab. Consultez la section des alternatives.