Entrainement
Pour que ca sois mieux !
Important ! La formation est uniquement pour les GPU NVIDIA. Si vous nâavez pas de GPU compatible, lâonglet Formation sera dĂ©sactivĂ©.
Comment utiliser le Tensorboard pour une formation correcte ? Consultez la section Tensorboard.
Ătape 1 : PrĂ©paration des donnĂ©es
- Téléchargez votre audio au format .wav en utilisant le Créateur de jeux de données ou configurez-le manuellement dans
applio/assets/datasets
en créant un dossier pour que le programme puisse le lire.
Ătape 2 : Traitement des donnĂ©es
- Une fois le modĂšle nommĂ© et le jeu de donnĂ©es sĂ©lectionnĂ©, appuyez sur âPrĂ©traiter le jeu de donnĂ©esâ et attendez le message dans le CMD.
Assurez-vous que votre jeu de données consiste en un seul fichier audio ou, si vous le divisez, assurez-vous que chaque segment audio a une durée de 10 à 15 secondes par audio.
- Vous pouvez sĂ©lectionner lâune des 3 frĂ©quences disponibles selon lâaudio
(38k, 40k, 48k)
, cela aidera Ă Ă©viter de filtrer plus dâartefacts ou de bruits de fond. - Vous ne savez pas comment vĂ©rifier le taux dâĂ©chantillonnage ? Consultez la section taux dâĂ©chantillonnage
Ătape 3 : Extraction des caractĂ©ristiques
- Sélectionnez une méthode F0 qui convient à vos besoins.
- (optionnel) modifiez la longueur de saut, une valeur plus basse, une plus grande douceur du changement de ton mais un entraĂźnement plus lent et vice versa.
Ătape 4 : Formation du modĂšle
Configurez les paramĂštres de formation selon vos besoins.
- Sauvegardez chaque Ă©poque : RĂ©glez cette valeur entre 10 et 50 pour dĂ©terminer la frĂ©quence Ă laquelle lâĂ©tat du modĂšle est sauvegardĂ© pendant la formation.
- Ăpoques totales : Le nombre dâĂ©poques nĂ©cessaires varie en fonction de votre jeu de donnĂ©es. Surveillez les progrĂšs en utilisant TensorBoard ; gĂ©nĂ©ralement, les modĂšles fonctionnent bien autour de 200-400 Ă©poques.
- Taille du lot : Ajustez en fonction de la VRAM de votre GPU. Pour 8 Go de VRAM, utilisez une taille de lot entre 6 et 8. ConsidĂ©rez les cĆurs CUDA lors de lâexpĂ©rimentation avec des tailles de lot plus Ă©levĂ©es.
Ătape finale : Sauvegarde du modĂšle et gĂ©nĂ©ration du fichier d'index
- Une fois la formation terminĂ©e, gĂ©nĂ©rez le fichier dâindex en cliquant sur le bouton âTrain Feature Indexâ.
Vous pouvez maintenant exporter votre modĂšle formĂ© directement depuis lâinterface Applio, allez dans la section Export Model dans lâonglet train, cliquez sur le bouton Refresh et sĂ©lectionnez le pth et lâindex ajoutĂ© du modĂšle Ă exporter.
- (Si vous souhaitez vous rĂ©entraĂźner, entrez le mĂȘme nom de modĂšle et localisez Ă quelle Ă©tape les fichiers de sauvegarde sont laissĂ©s, entrez un nombre plus Ă©levĂ© dâepoch.)
- Votre modÚle formé se trouve dans le dossier logs/model, et les fichiers .pth sont dans le dossier logs/zips.
- Si vous nâavez pas de GPU NVIDIA, vous pouvez essayer Applio Colab. Consultez la section des alternatives.