🔴Voice Changer en Temps Réel

Pas de prank avec, c'est pas cool.

I. Installation du Voice Changer :

Pour commencer, téléchargez l'archive correspondante :

Pour Windows et GPU Nvidia : Télécharger
Pour Windows et GPU AMD : Télécharger
Pour macOS (Apple Silicon) : 15 ou 14 (Utilisateur Intel: Voir ci-dessous)

Ensuite, vous devez extraire l'archive dans votre disque principal. Pour ce faire, faites un clic droit dessus, puis sélectionnez l'option d'extraction. Si vous êtes sur Mac, double-cliquez simplement dessus pour l'ouvrir.

Note importante pour les utilisateurs de GPU AMD :

N'oubliez pas de convertir tous les modèles que vous utilisez de PTH à ONNX. Votre GPU ne prendra en charge que les modèles au format ONNX.

Mise a Jour :

Lors de la mise à jour, supprimez tout SAUF ce qui suit :

Le dossier model_dir
Votre raccourci pour démarrer start_http.bat
Le script VBS si vous l'avez créé pour qu'aucune invite de commande n'apparaisse.

N'oubliez pas de remettre vos paramètres supplémentaires, de découpage et audio à une valeur supérieure à celle de la réversion, car il arrive parfois qu'ils affichent des valeurs incorrectes.

Cela inclut également le S.R. pour le mode serveur si vous l'utilisez.

II. Configuration de VB-Cable (Pour le son virtuel) :

Le VB-Cable est nécessaire pour envoyer le son vers le micro virtuel afin de l'envoyer à Discord ou à tout autre logiciel.

Allez sur la page officielle de VB-Audio pour VB-Cable et cliquez sur "Télécharger".
Cela enregistrera une archive .zip que vous devrez extraire dans un nouveau dossier vide.
Exécutez `setup_x64.exe` (pour Windows 64-bits) ou `setup.exe` (pour Windows 32-bits).
Après l'installation, redémarrez votre PC pour que Windows détecte le périphérique audio VB-Cable.

III. Utilisation du Voice Changer :

Pour utiliser le voice changer, suivez ces étapes :

Ouvrez le dossier que vous avez extrait précédemment.
Exécutez le fichier start_http.
Des modèles vont commencer à être téléchargés. La durée de ce processus dépendra de votre connexion internet.
Après quelques minutes, l'application devrait s'ouvrir. Voici à quoi cela doit ressembler :

IV. Réglages recommandés :

Voici les paramètres que je recommande d'utiliser pour une meilleure expérience :

GPU NVIDIA

f0: RMVPE ou CREPE_TINY

Chunk: 112

Extra: 4096-16384

GPU AMD/INTEL

f0: RMVPE_ONNX ou CREPE_TINY

Chunk: 112,

Extra: 4096-16384

CPU

f0: Dio ou Harvest

Chunk: 448

Extra: 4096-8192

Mac

M1, M1 Pro, M1 Max et M1 Ultra, M2 :

f0: Harvest ou RMVPE_ONNX ou CREPE_TINY

Chunk: 448

Extra: 131072 ou 65536

M2 Max et + :

f0: RMVPE ou RMVPE_ONNX ou CREPE_TINY

Chunk: 256

Extra: 65536

Faites attention à l'option "Extra". Plus la valeur est élevée, plus la puissance de traitement du CPU sera utilisée.
La quantité de "Chunk" affecte le délai avant que l'audio traité par le voice changer ne soit transmis à VB-Cable.

Il est recommandé de régler ces paramètres en fonction de vos besoins et de la puissance de votre système.

V. Configuration des paramètres audio :

Pour obtenir la meilleure qualité audio, suivez ces étapes pour configurer les paramètres audio :

Sélectionnez l'option audio du serveur. Elle est plus rapide que l'audio du client.
Choisissez vos périphériques audio :

Sélectionnez votre microphone principal pour l'entrée.
Sélectionnez le périphérique audio VB-Cable : « [MME] CABLE Input (VB-Audio Virtual Cable) » pour la sortie.
Utilisez le moniteur pour écouter l'audio de sortie. Sélectionnez votre casque.

Assurez-vous que votre casque est correctement configuré comme périphérique de sortie par défaut dans les paramètres système.

Si vous utilisez d'autres logiciels tels que Discord, configurez-les comme suit :

Pour l'entrée, sélectionnez « CABLE Output ».
Pour la sortie, choisissez votre casque.

Ces configurations garantiront que le voice changer fonctionne correctement avec vos autres applications.

VI. Sélection du modèle "f0Detector" pour la conversion vocale :

Vous pouvez choisir celui que vous voulez mais nous vous recommandons ceux des IV. Réglages recommandés :

GPU AMD: rmvpe-onnx ou crepe_tiny

Le choix du modèle "f0Detector" dépend de la manière dont vous comptez l'utiliser, que ce soit pour chanter, parler, rapper, etc. Voici des recommandations pour différents cas d'utilisation :

- RMVPE : Il offre une excellente qualité et est très performant, adapté à tout.

- Harvest : Convient aux conversations de base et au rap avec des tonalités plus basses.

- Dio : Convient aux conversations de base et au rap avec des tonalités moyennes/élevées.

- Crepe / Crepe-full : Recommandés pour parler et chanter avec diverses tonalités.

- Crepe-tiny : Une version plus rapide et moins gourmande en puissance de traitement du modèle Crepe, idéale pour de nombreux usages.

Sélectionnez le modèle en fonction de vos besoins spécifiques pour obtenir les meilleurs résultats possibles avec la conversion vocale.

VII. Suppression du bruit :

Vous avez la possibilité d'activer ou de désactiver la fonction de suppression du bruit. Cependant, veuillez noter que cette fonction est disponible uniquement en mode "Client Device". Il est important de noter que la suppression du bruit en mode "Client Device" est plus lente par rapport au mode "Server Device". Pour l'activer, cochez la case à côté de "Sup1" ou "Sup2". Cette option est efficace pour réduire considérablement le bruit indésirable. Cependant, gardez à l'esprit que cela peut avoir un impact sur la qualité audio et augmenter la charge de traitement du CPU.

NVIDIA Broadcast peut fonctionner extrêmement bien. Cependant, lors d'un redémarrage du système, si vous ne configurez pas ses paramètres par défaut séparément de tout le reste, il peut choisir simplement le câble virtuel comme microphone et ne pas fonctionner. Pour le faire, ouvrez les paramètres sonores, faites défiler jusqu'à pouvoir appuyer sur "Volume des applications et préférences de l'appareil", trouvez la zone de saisie pour cette application choisissez votre microphone réel. Cela résout tout problème avec le déèglement du modificateur vocal, d'après mes tests.

Steelseries Sonar: Elle intègre Clearcast, qui est une excellente fonction d'élimination du bruit bien qu'elle ne soit pas aussi performante que celle de NVIDIA Broadcast. N'importe qui devrait être capable de l'utiliser.

VIII. Recommandations pour les paramètres avancés :

Les paramètres avancés suivants sont recommandés pour une expérience optimale. Suivez ces recommandations pour obtenir les meilleurs résultats :

IX. Lancer le Voice Changer :

Après avoir configuré tous les paramètres, sélectionnez le modèle vocal souhaité dans la liste en cliquant dessus :

Cliquez sur le bouton "Démarrer" et attendez les messages qui s'affichent dans la sortie de la fenêtre de commande (CMD) semblables à ceux-ci :

Ces indications vous permettront de vérifier que le processus fonctionne correctement.

X. Chargement de modèles audio RVC personnalisés dans le Voice Changer :

Si vous souhaitez charger vos propres modèles audio dans le Voice Changer, suivez ces étapes :

Cliquez sur le bouton "Modifier" dans la liste des modèles. Cela ouvrira ce menu.
Cliquez sur "Télécharger" et sélectionnez le fichier .pth/.onnx du modèle que vous souhaitez utiliser.
Une fois le modèle téléchargé, cliquez sur le texte "pas d'image" à gauche pour définir une image représentant le modèle.

Vous ne pouvez pas supprimer les modèles RVC déjà téléchargés. Pour les remplacer, téléchargez simplement un nouveau modèle à leur place.

XI. Utilisation d'ONNX par rapport à PTH :

Pour la conversion vocale en temps réel, vous avez également la possibilité d'utiliser des versions ONNX des modèles vocaux RVC.

Lorsque vous téléchargez un modèle personnalisé, importez un fichier .onnx au lieu d'un fichier .pth

Il y a peu d'informations confirmant si .onnx est intrinsèquement meilleur que .pth, mais certains tests indiquent que .onnx peut être plus rapide que .pth pour la conversion vocale en temps réel.

Si vous possédez un fichier .pth et souhaitez le convertir en .onnx, vous pouvez le faire via le Voice Changer de W-Okada :

Sélectionnez le modèle que vous souhaitez convertir en .onnx, puis cliquez sur "Exporter en .onnx".

L'utilisation de fichiers .onnx peut potentiellement améliorer la vitesse de la conversion vocale en temps réel. Expérimentez pour voir quelle option vous convient le mieux.

XII. Optimisations Audiodg.exe

Ouvrez le gestionnaire de tâches (task manager), cliquez sur "Détails" (details).

Cliquez avec le bouton droit de la souris sur audiodg.exe et définissez la priorité sur "Élevée" (HIGH).

Cliquez à nouveau avec le bouton droit de la souris et appuyez sur "Définir l'affinité" (set affinity), puis choisissez uniquement le processeur CPU 2.

En ce qui concerne le nombre de cœurs, choisissez un nombre pair, correspondant à votre véritable cœur de processeur.

PrécédentText To Speech - RVC V2 SuivantRecherche ton modèle

Dernière mise à jour il y a 10 mois