W-Okada
Changement de voix en temps réel !
I. Installation du modificateur de voix :
Téléchargement
Pour commencer, téléchargez l’archive correspondante, allez sur ce site puis sélectionnez votre version (nom du fichier) :
- Pour Windows et GPU Nvidia :
MMVCServerSIO_win_onnxgpu-cuda_v*
1 - Téléchargement pour Windows et GPU AMD :
MMVCServerSIO_win_onnxdirectML-cuda_v*
1
Note importante pour les utilisateurs de GPU AMD N’oubliez pas de convertir tous les modèles que vous utilisez de PTH à ONNX. Votre GPU ne prendra en charge que les modèles au format ONNX.
- Téléchargement pour macOS (Apple Silicon) :
MMVCServerSIO_mac_onnxcpu-nocuda_v*
1
Extraction
Ensuite, vous devez extraire l’archive sur votre disque principal. Pour cela, faites un clic droit dessus et sélectionnez l’option d’extraction. Si vous êtes sur Mac, double-cliquez simplement dessus pour l’ouvrir.
Mise à jour :
Lors de la mise à jour, supprimez tout SAUF les éléments suivants :
- Le dossier
model_dir
- Votre raccourci pour
start_http.bat
- Le
script VBS
si vous en avez créé un pour éviter l’apparition d’une invite de commande.
N’oubliez pas de réinitialiser vos paramètres supplémentaires, le clipping et l’audio à une valeur supérieure à la précédente, car parfois ils affichent des valeurs incorrectes.
Cela inclut également le S.R. pour le mode serveur si vous l’utilisez.
II. Configuration de VB-Cable (Pour le son virtuel) :
VB-Cable est nécessaire pour envoyer le son au microphone virtuel pour une utilisation avec Discord ou d’autres logiciels.
Téléchargement
Allez sur la page officielle de VB-Audio pour VB-Cable et cliquez sur “Télécharger
”
Extraction
Cela téléchargera une archive .zip
que vous devrez extraire dans un nouveau dossier vide.
Installation
Exécutez setup_x64.exe
(pour Windows 64 bits), setup.exe
(pour Windows 32 bits) ou VBCable_MACDriver_Pack*.dmg
1 (pour MacOS).
Redémarrage
Après l’installation, redémarrez votre PC/Mac pour que le système d’exploitation détecte le périphérique audio VB-Cable.
III. Utilisation du modificateur de voix :
Pour utiliser le modificateur de voix, suivez ces étapes :
Ouverture
Ouvrez le dossier que vous avez extrait précédemment.
Exécution
Exécutez le start_http
.
Téléchargement
Les modèles commenceront à se télécharger. La durée de ce processus dépend de votre connexion Internet.
Ouverture
Après quelques minutes, l’application devrait s’ouvrir.
IV. Paramètres recommandés :
Voici les paramètres que je recommande d’utiliser pour une meilleure expérience :
Matériel | f0 | Chunk | Supplémentaire |
---|---|---|---|
GPU NVIDIA | RMVPE ou CREPE_TINY | 112 | 4096-16384 |
GPU AMD/INTEL | RMVPE_ONNX ou CREPE_TINY | 112 | 4096-16384 |
CPU | Dio ou Harvest | 448 | 4096-8192 |
Mac M2 Max et - | Harvest ou RMVPE_ONNX ou CREPE_TINY | 448 | 131072 |
Mac M2 Max et + | RMVPE ou RMVPE_ONNX ou CREPE_TINY | 256 | 65536 |
- Faites attention à l’option “
Supplémentaire
”. Une valeur plus élevée utilisera plus de puissance de traitement CPU. - La quantité de “
Chunk
” affecte le délai avant que l’audio traité par le modificateur de voix ne soit transmis à VB-Cable.
Il est recommandé d’ajuster ces paramètres en fonction de vos besoins et de la puissance de votre système.
V. Configuration des paramètres audio :
Pour obtenir la meilleure qualité audio, suivez ces étapes pour configurer les paramètres audio :
Sélection du serveur audio
Sélectionnez l’option audio du serveur. Elle est plus rapide que l’audio du client.
Périphériques audio
Choisissez vos périphériques audio :
- Sélectionnez votre microphone principal pour l’entrée.
- Choisissez le périphérique audio VB-Cable : “
[MME] CABLE Input (VB-Audio Virtual Cable)
” pour la sortie. - Utilisez le moniteur pour écouter l’audio de sortie. Sélectionnez votre casque.
Assurez-vous que votre casque est correctement configuré comme périphérique de sortie par défaut dans les paramètres du système.
Si vous utilisez d’autres logiciels comme Discord, configurez-les comme suit :
- Pour l’entrée, sélectionnez «
CABLE Output
». - Pour la sortie, choisissez votre casque.
Ces configurations garantiront que le modificateur de voix fonctionne correctement avec vos autres applications.
VI. Sélection du modèle “f0Detector” pour la conversion vocale :
Vous pouvez choisir n’importe quel modèle, mais nous recommandons ceux mentionnés dans IV. Paramètres recommandés
GPU AMD : rmvpe-onnx
ou crepe_tiny
Le choix du modèle “f0Detector” dépend de votre intention d’utilisation, que ce soit pour chanter, parler, rapper, etc. Voici quelques recommandations pour différents cas d’utilisation :
- RMVPE : Il offre une excellente qualité et performance, adapté à tous les usages.
- Harvest : Adapté pour des conversations basiques et du rap avec des tons plus bas.
- Dio : Adapté pour des conversations basiques et du rap avec des tons moyens/élevés.
- Crepe / Crepe-full : Recommandé pour parler et chanter avec divers tons.
- Crepe-tiny : Une version plus rapide et moins gourmande en ressources du modèle Crepe, idéale pour de nombreux usages.
Sélectionnez le modèle en fonction de vos besoins spécifiques pour obtenir les meilleurs résultats possibles avec la conversion vocale.
VII. Suppression du bruit :
Vous avez la possibilité d’activer ou de désactiver la fonction de suppression du bruit. Cependant, veuillez noter que cette fonction n’est disponible qu’en mode “Client Device”. Il est important de noter que la suppression du bruit en mode “Client Device” est plus lente comparée au mode “Server Device”. Pour l’activer, cochez la case à côté de “Sup1
” ou “Sup2
”. Cette option est efficace pour réduire considérablement le bruit indésirable. Cependant, gardez à l’esprit qu’elle peut affecter la qualité audio et augmenter la charge de traitement du CPU.
- NVIDIA Broadcast fonctionne extrêmement bien. Cependant, après un redémarrage du système, si vous ne définissez pas ses paramètres par défaut séparément de tout le reste, il pourrait choisir le câble virtuel comme microphone et ne pas fonctionner. Pour ce faire, ouvrez les paramètres sonores, faites défiler jusqu’à où vous pouvez appuyer sur “Préférences de volume et de périphérique par application”, trouvez la zone d’entrée pour cette application, et choisissez votre microphone réel. Cela résout tout problème avec le modificateur de voix qui se bloque, selon mes tests.
- Steelseries Sonar intègre Clearcast, qui est une excellente fonction d’élimination du bruit, bien que moins efficace que NVIDIA Broadcast. Tout le monde devrait pouvoir l’utiliser.
VIII. Recommandations pour les paramètres avancés :
Les paramètres avancés suivants sont recommandés pour une expérience optimale. Suivez ces recommandations pour obtenir les meilleurs résultats :
- Protocole : sio
- Fondu enchaîné : Chevauchement : 4096 Début : 0.1 Fin : 1
- Tronquer : 300
- SilenceFront : activé
- Protéger : 0.5
- Qualité RVC : faible
IX. Démarrage du modificateur de voix :
Après avoir configuré tous les paramètres, sélectionnez le modèle vocal désiré dans la liste en cliquant dessus.
Cliquez sur le bouton “Démarrer
” et attendez que des messages apparaissent dans la fenêtre de commande.
X. Chargement de modèles audio RVC personnalisés dans le modificateur de voix :
Si vous souhaitez charger vos propres modèles audio dans le modificateur de voix, suivez ces étapes :
Ouverture
Cliquez sur le bouton “Modifier
” dans la liste des modèles. Cela ouvrira ce menu.
Téléchargement
Cliquez sur “Télécharger
” et sélectionnez le fichier .pth/.onnx
du modèle que vous souhaitez utiliser.
Image
Une fois le modèle téléchargé, cliquez sur le texte “pas d'image
” à gauche pour définir une image représentant le modèle.
⚠️ Veuillez noter que vous ne pouvez pas supprimer les modèles RVC déjà téléchargés. Pour les remplacer, téléchargez simplement un nouveau modèle à leur place.
XI. Utilisation de ONNX vs. PTH :
Pour la conversion vocale en temps réel, vous avez également la possibilité d’utiliser des versions ONNX des modèles audio RVC.
- Lors du téléchargement d’un modèle personnalisé, importez un fichier
.onnx
au lieu d’un fichier.pth
.
Il y a peu d’informations confirmées sur le fait que .onnx
soit intrinsèquement meilleur que .pth
, mais certains tests suggèrent que .onnx
pourrait être plus rapide que .pth
pour la conversion vocale en temps réel.
Si vous avez un fichier .pth
et souhaitez le convertir en .onnx, vous pouvez le faire via le modificateur de voix de W-Okada :
- Sélectionnez le modèle que vous souhaitez convertir en
.onnx
, puis cliquez sur “Exporter en .onnx
”
L’utilisation de fichiers .onnx
peut potentiellement améliorer la vitesse de conversion vocale en temps réel. Expérimentez pour voir quelle option fonctionne le mieux pour vous.
XII. Optimisations de audiodg.exe :
Ouverture
Ouvrez le Gestionnaire des tâches, cliquez sur “Détails
”
Priorité
Clic droit sur audiodg.exe
et définissez la priorité à “Élevée
”
Affinité
Clic droit à nouveau et choisissez “Définir l'affinité
” puis sélectionnez seulement CPU 2.
Concernant le nombre de cœurs, choisissez un nombre pair correspondant à votre processeur actuel.