I. Installation du modificateur de voix :

1

Téléchargement

Pour commencer, téléchargez l’archive correspondante, allez sur ce site puis sélectionnez votre version (nom du fichier) :

  • Pour Windows et GPU Nvidia : MMVCServerSIO_win_onnxgpu-cuda_v* 1
  • Téléchargement pour Windows et GPU AMD : MMVCServerSIO_win_onnxdirectML-cuda_v* 1

Note importante pour les utilisateurs de GPU AMD N’oubliez pas de convertir tous les modèles que vous utilisez de PTH à ONNX. Votre GPU ne prendra en charge que les modèles au format ONNX.

  • Téléchargement pour macOS (Apple Silicon) : MMVCServerSIO_mac_onnxcpu-nocuda_v* 1
2

Extraction

Ensuite, vous devez extraire l’archive sur votre disque principal. Pour cela, faites un clic droit dessus et sélectionnez l’option d’extraction. Si vous êtes sur Mac, double-cliquez simplement dessus pour l’ouvrir.

Mise à jour :

Lors de la mise à jour, supprimez tout SAUF les éléments suivants :

  • Le dossier model_dir
  • Votre raccourci pour start_http.bat
  • Le script VBS si vous en avez créé un pour éviter l’apparition d’une invite de commande.

N’oubliez pas de réinitialiser vos paramètres supplémentaires, le clipping et l’audio à une valeur supérieure à la précédente, car parfois ils affichent des valeurs incorrectes.

Cela inclut également le S.R. pour le mode serveur si vous l’utilisez.

II. Configuration de VB-Cable (Pour le son virtuel) :

VB-Cable est nécessaire pour envoyer le son au microphone virtuel pour une utilisation avec Discord ou d’autres logiciels.

1

Téléchargement

Allez sur la page officielle de VB-Audio pour VB-Cable et cliquez sur “Télécharger

2

Extraction

Cela téléchargera une archive .zip que vous devrez extraire dans un nouveau dossier vide.

3

Installation

Exécutez setup_x64.exe (pour Windows 64 bits), setup.exe (pour Windows 32 bits) ou VBCable_MACDriver_Pack*.dmg1 (pour MacOS).

4

Redémarrage

Après l’installation, redémarrez votre PC/Mac pour que le système d’exploitation détecte le périphérique audio VB-Cable.

III. Utilisation du modificateur de voix :

Pour utiliser le modificateur de voix, suivez ces étapes :

1

Ouverture

Ouvrez le dossier que vous avez extrait précédemment.

2

Exécution

Exécutez le start_http.

3

Téléchargement

Les modèles commenceront à se télécharger. La durée de ce processus dépend de votre connexion Internet.

4

Ouverture

Après quelques minutes, l’application devrait s’ouvrir.

IV. Paramètres recommandés :

Voici les paramètres que je recommande d’utiliser pour une meilleure expérience :

Matérielf0ChunkSupplémentaire
GPU NVIDIARMVPE ou CREPE_TINY1124096-16384
GPU AMD/INTELRMVPE_ONNX ou CREPE_TINY1124096-16384
CPUDio ou Harvest4484096-8192
Mac M2 Max et -Harvest ou RMVPE_ONNX ou CREPE_TINY448131072
Mac M2 Max et +RMVPE ou RMVPE_ONNX ou CREPE_TINY25665536
  • Faites attention à l’option “Supplémentaire”. Une valeur plus élevée utilisera plus de puissance de traitement CPU.
  • La quantité de “Chunk” affecte le délai avant que l’audio traité par le modificateur de voix ne soit transmis à VB-Cable.

Il est recommandé d’ajuster ces paramètres en fonction de vos besoins et de la puissance de votre système.

V. Configuration des paramètres audio :

Pour obtenir la meilleure qualité audio, suivez ces étapes pour configurer les paramètres audio :

1

Sélection du serveur audio

Sélectionnez l’option audio du serveur. Elle est plus rapide que l’audio du client.

2

Périphériques audio

Choisissez vos périphériques audio :

  • Sélectionnez votre microphone principal pour l’entrée.
  • Choisissez le périphérique audio VB-Cable : “[MME] CABLE Input (VB-Audio Virtual Cable)” pour la sortie.
  • Utilisez le moniteur pour écouter l’audio de sortie. Sélectionnez votre casque.

Assurez-vous que votre casque est correctement configuré comme périphérique de sortie par défaut dans les paramètres du système.

Si vous utilisez d’autres logiciels comme Discord, configurez-les comme suit :

  • Pour l’entrée, sélectionnez « CABLE Output ».
  • Pour la sortie, choisissez votre casque.

Ces configurations garantiront que le modificateur de voix fonctionne correctement avec vos autres applications.

VI. Sélection du modèle “f0Detector” pour la conversion vocale :

Vous pouvez choisir n’importe quel modèle, mais nous recommandons ceux mentionnés dans IV. Paramètres recommandés

GPU AMD : rmvpe-onnx ou crepe_tiny

Le choix du modèle “f0Detector” dépend de votre intention d’utilisation, que ce soit pour chanter, parler, rapper, etc. Voici quelques recommandations pour différents cas d’utilisation :

  • RMVPE : Il offre une excellente qualité et performance, adapté à tous les usages.
  • Harvest : Adapté pour des conversations basiques et du rap avec des tons plus bas.
  • Dio : Adapté pour des conversations basiques et du rap avec des tons moyens/élevés.
  • Crepe / Crepe-full : Recommandé pour parler et chanter avec divers tons.
  • Crepe-tiny : Une version plus rapide et moins gourmande en ressources du modèle Crepe, idéale pour de nombreux usages.

Sélectionnez le modèle en fonction de vos besoins spécifiques pour obtenir les meilleurs résultats possibles avec la conversion vocale.

VII. Suppression du bruit :

Vous avez la possibilité d’activer ou de désactiver la fonction de suppression du bruit. Cependant, veuillez noter que cette fonction n’est disponible qu’en mode “Client Device”. Il est important de noter que la suppression du bruit en mode “Client Device” est plus lente comparée au mode “Server Device”. Pour l’activer, cochez la case à côté de “Sup1” ou “Sup2”. Cette option est efficace pour réduire considérablement le bruit indésirable. Cependant, gardez à l’esprit qu’elle peut affecter la qualité audio et augmenter la charge de traitement du CPU.

  • NVIDIA Broadcast fonctionne extrêmement bien. Cependant, après un redémarrage du système, si vous ne définissez pas ses paramètres par défaut séparément de tout le reste, il pourrait choisir le câble virtuel comme microphone et ne pas fonctionner. Pour ce faire, ouvrez les paramètres sonores, faites défiler jusqu’à où vous pouvez appuyer sur “Préférences de volume et de périphérique par application”, trouvez la zone d’entrée pour cette application, et choisissez votre microphone réel. Cela résout tout problème avec le modificateur de voix qui se bloque, selon mes tests.
  • Steelseries Sonar intègre Clearcast, qui est une excellente fonction d’élimination du bruit, bien que moins efficace que NVIDIA Broadcast. Tout le monde devrait pouvoir l’utiliser.

VIII. Recommandations pour les paramètres avancés :

Les paramètres avancés suivants sont recommandés pour une expérience optimale. Suivez ces recommandations pour obtenir les meilleurs résultats :

  • Protocole : sio
  • Fondu enchaîné : Chevauchement : 4096 Début : 0.1 Fin : 1
  • Tronquer : 300
  • SilenceFront : activé
  • Protéger : 0.5
  • Qualité RVC : faible

IX. Démarrage du modificateur de voix :

Après avoir configuré tous les paramètres, sélectionnez le modèle vocal désiré dans la liste en cliquant dessus.

Cliquez sur le bouton “Démarrer” et attendez que des messages apparaissent dans la fenêtre de commande.

X. Chargement de modèles audio RVC personnalisés dans le modificateur de voix :

Si vous souhaitez charger vos propres modèles audio dans le modificateur de voix, suivez ces étapes :

1

Ouverture

Cliquez sur le bouton “Modifier” dans la liste des modèles. Cela ouvrira ce menu.

2

Téléchargement

Cliquez sur “Télécharger” et sélectionnez le fichier .pth/.onnx du modèle que vous souhaitez utiliser.

3

Image

Une fois le modèle téléchargé, cliquez sur le texte “pas d'image” à gauche pour définir une image représentant le modèle.

⚠️ Veuillez noter que vous ne pouvez pas supprimer les modèles RVC déjà téléchargés. Pour les remplacer, téléchargez simplement un nouveau modèle à leur place.

XI. Utilisation de ONNX vs. PTH :

Pour la conversion vocale en temps réel, vous avez également la possibilité d’utiliser des versions ONNX des modèles audio RVC.

  • Lors du téléchargement d’un modèle personnalisé, importez un fichier .onnx au lieu d’un fichier .pth.

Il y a peu d’informations confirmées sur le fait que .onnx soit intrinsèquement meilleur que .pth, mais certains tests suggèrent que .onnx pourrait être plus rapide que .pth pour la conversion vocale en temps réel.

Si vous avez un fichier .pth et souhaitez le convertir en .onnx, vous pouvez le faire via le modificateur de voix de W-Okada :

  • Sélectionnez le modèle que vous souhaitez convertir en .onnx, puis cliquez sur “Exporter en .onnx

L’utilisation de fichiers .onnx peut potentiellement améliorer la vitesse de conversion vocale en temps réel. Expérimentez pour voir quelle option fonctionne le mieux pour vous.

XII. Optimisations de audiodg.exe :

1

Ouverture

Ouvrez le Gestionnaire des tâches, cliquez sur “Détails

2

Priorité

Clic droit sur audiodg.exe et définissez la priorité à “Élevée

3

Affinité

Clic droit à nouveau et choisissezDéfinir l'affinité” puis sélectionnez seulement CPU 2.

Concernant le nombre de cœurs, choisissez un nombre pair correspondant à votre processeur actuel.


Footnotes

  1. L’astérisque (*) signifie que des chiffres ou des lettres peuvent 2 3 4