Bienvenue sur RVC đ
đ» Local
- W-Okada
- Applio
- Mangio
đ Online
- Ilaria
- Applio
đ Autre Guide
- ModĂšles
- Dataset
- Isolation de l'Audio
FAQ
Foire aux Questions !
Informations de Base sur RVC
RVC (Retrieval-Based Voice Conversion) est une technique de clonage vocal avancĂ©e utilisant la synthĂšse vocale pour convertir ou modifier une voix cible en utilisant lâintelligence artificielle.
Pour lâentraĂźnement local, une carte graphique Nvidia RTX sĂ©rie 20 avec 8 Go de VRAM est nĂ©cessaire. Pour lâinfĂ©rence, un CPU dĂ©cent avec au moins 4 Go de VRAM suffit. Les processeurs Celeron devraient envisager dâautres alternatives disponibles ici.
RVC peut ĂȘtre utilisĂ© sur un Mac uniquement pour lâinfĂ©rence. Lâinstallation doit ĂȘtre rĂ©alisĂ©e comme sur Linux.
Composants Techniques de RVC
Un âepochâ dĂ©signe un cycle complet de passage de lâensemble des donnĂ©es Ă travers le rĂ©seau lors de lâentraĂźnement dâun modĂšle. Plusieurs centaines dâepochs peuvent ĂȘtre nĂ©cessaires pour optimiser la performance du modĂšle. Un nombre excessif dâepochs peut toutefois mener Ă un surapprentissage, diminuant la capacitĂ© du modĂšle Ă gĂ©nĂ©raliser.
Le âpitchâ en musique dĂ©termine la hauteur dâun son. Modifier le pitch dâune mĂ©lodie peut la rendre plus aiguĂ« ou plus grave, influençant ainsi les Ă©motions et lâambiance transmises.
Le âFeature Retrievalâ concerne lâextraction de caractĂ©ristiques spĂ©cifiques dâun signal audio, telles que le timbre, le rythme, ou le volume. Ces caractĂ©ristiques sont utilisĂ©es pour analyser ou modifier le signal audio de maniĂšre ciblĂ©e.
Le choix du modĂšle âf0Detectorâ dĂ©pend de la maniĂšre dont vous comptez lâutiliser, que ce soit pour chanter, parler, rapper, etc. Voici des recommandations pour diffĂ©rents cas dâutilisation :
- RMVPE : Il offre une excellente qualité et est trÚs performant, adapté à tout.
- Harvest : Convient aux conversations de base et au rap avec des tonalités plus basses.
- Dio : Convient aux conversations de base et au rap avec des tonalités moyennes/élevées.
- Crepe / Crepe-full : Recommandés pour parler et chanter avec diverses tonalités.
- Crepe-tiny : Une version plus rapide et moins gourmande en puissance de traitement du modÚle Crepe, idéale pour de nombreux usages.
Sélectionnez le modÚle en fonction de vos besoins spécifiques pour obtenir les meilleurs résultats possibles avec la conversion vocale.
Un dataset, en français âensemble de donnĂ©esâ, est une collection structurĂ©e de donnĂ©es qui sont gĂ©nĂ©ralement organisĂ©es en tableaux, listes, fichiers ou dâautres formats similaires. Ces donnĂ©es peuvent ĂȘtre de nature variĂ©e, telles que des chiffres, des textes, des images, des vidĂ©os, etc. Pour crĂ©e des voix les donnĂ©es seront des audio.
Un ModĂšle est le rĂ©sultat dâun entraĂźnement.
Lâindex ajoutĂ© contient le Dataset compressĂ© et gĂšre les tonalitĂ©s du modĂšle lors de lâinfĂ©rence.
Pth stocke toutes les donnĂ©es du modĂšle entraĂźnĂ© utilisĂ©es pour lâinfĂ©rence.
La taille du lot indique la quantitĂ© de GPU utilisĂ©e pour lâentraĂźnement. Des tailles plus grandes rĂ©duisent la durĂ©e dâentraĂźnement. Il est recommandĂ© dâutiliser des multiples de 4, avec 8 Ă©tant le plus courant.
LâinfĂ©rence transforme un audio avec le modĂšle vocal. Lâartifacting dĂ©crit les distorsions sonores telles que le bruit de fond et la modulation robotique lors de lâinfĂ©rence.
Un modĂšle prĂ©-entraĂźnĂ© utilise des audios de longue durĂ©e comme base dâentraĂźnement. Le sur-entraĂźnement survient lorsque le modĂšle devient moins capable dâarticuler clairement et sonne robotique.
G (GĂ©nĂ©rateur) et D (Discriminateur) stockent et traitent les donnĂ©es dâentraĂźnement. G tente de reproduire des rĂ©sultats fidĂšles Ă lâoriginal, tandis que D diffĂ©rencie les donnĂ©es rĂ©elles des crĂ©ations de G.
Questions Générales sur RVC
Cette erreur indique que le chemin dâaccĂšs au rĂ©pertoire nĂ©cessaire nâest pas correctement configurĂ©. Ajouter le chemin dâaccĂšs au rĂ©pertoire âruntime/scriptsâ dâApplio-RVC-Fork Ă la variable PATH de Windows peut rĂ©soudre ce problĂšme.
Les ajustements dépendent de la tonalité de la voix et des caractéristiques désirées. Il est conseillé de tester différents réglages pour trouver ceux qui conviennent le mieux à chaque cas.
- NVIDIA GeForce RTX 30xx Series (par exemple, RTX 3090, RTX 3080)
- NVIDIA GeForce RTX 20xx Series (par exemple, RTX 2080 Ti, RTX 2070)
- NVIDIA Quadro Series (pour des performances professionnelles)
- NVIDIA Tesla Series (pour des charges de travail intensives en IA)
- NVIDIA A100 (pour des tĂąches intensives en IA et des performances extrĂȘmes)
- AMD Radeon Instinct Series (pour des tĂąches professionnelles)
Cependant, il est important de noter que les performances en matiĂšre de clonage vocal dĂ©pendent Ă©galement du logiciel que vous utilisez. Certains logiciels de clonage vocal peuvent tirer parti des spĂ©cificitĂ©s de certaines cartes graphiques ou dâautres accĂ©lĂ©rateurs matĂ©riels. Avant dâacheter une carte graphique pour le clonage vocal, vĂ©rifiez les recommandations spĂ©cifiques du logiciel que vous utilisez.
DĂ©jĂ :
pip install -r Requirements.txt
Sinon :
Si vous continuez Ă obtenir des erreurs âNo module namedâ, cela signifie que Python ne peut pas trouver certaines bibliothĂšques. Voici comment rĂ©soudre cela :
- Identifiez le nom du module manquant dans le message dâerreur.
- ExĂ©cutez la commande suivante pour installer le module manquant (remplacez ânom du moduleâ par le nom rĂ©el du module) :
pip install "nom du module"
RĂ©pĂ©tez cette Ă©tape pour chaque module manquant jusquâĂ ce que toutes les erreurs disparaissent. Si rien ne fonctionne supprimer tout et reinstaller.
Utiliser un GPU accélÚre considérablement le traitement par rapport à un CPU, surtout pour des tùches exigeantes comme le traitement vocal.
VĂ©rifier les raccourcis clavier dans les prĂ©fĂ©rences dâAudacity pour sâassurer que la commande est correctement configurĂ©e.
Indiquer le chemin dâaccĂšs complet au fichier audio que lâon souhaite traiter. Assurez-vous que le chemin est correct et que le fichier existe.
Questions sur le Voice Changer en Temps RĂ©el
Les ajustements doivent ĂȘtre expĂ©rimentĂ©s et ajustĂ©s progressivement. LâĂ©coute attentive permettra de trouver les rĂ©glages les plus adĂ©quats pour chaque type de voix.
Ce message indique que le fichier ou le rĂ©pertoire spĂ©cifiĂ© nâexiste pas. VĂ©rifiez le chemin dâaccĂšs et assurez-vous que le fichier ou le dossier existe bien Ă lâemplacement spĂ©cifiĂ©.
Sur le logiciel du Voice Changer:
- SĂ©lectionnez votre microphone principal pour lâentrĂ©e.
- Sélectionnez le périphérique audio VB-Cable :
« [MME] CABLE Input (VB-Audio Virtual Cable) »
pour la sortie. - Utilisez le moniteur pour Ă©couter lâaudio de sortie. SĂ©lectionnez votre casque.
Assurez-vous que votre casque est correctement configuré comme périphérique de sortie par défaut dans les paramÚtres systÚme.
Sur un autre logiciel:
Si vous utilisez dâautres logiciels tels que Discord, configurez-les comme suit :
- Pour lâentrĂ©e, sĂ©lectionnez
« CABLE Output »
. - Pour la sortie, choisissez votre casque.
Tout dâabord, passez par VB-Audio Cable, je trouve que câest plus simple que Voicemeeter, donc ce tuto sera uniquement pour VB Audio. Le lien si jamais vous voulez le tĂ©lĂ©charger : https://vb-audio.com/Cable/
Vous le tĂ©lĂ©chargez sur Windows ou Mac selon sur quoi vous ĂȘtes. Une fois tĂ©lĂ©chargĂ©, vous allez exĂ©cuter VBCABLE_Setup
en administrateur, si rien ne sâouvre, faites pareil avec VBCABLE_Setup_x64
(en administrateur aussi). Lorsque lâapplication sâouvre, installez-la et redĂ©marrez votre pc.
Une fois le redĂ©marrage effectuĂ©, ouvrez RVC, et en bas Ă gauche, dans la catĂ©gorie âAUDIOâ, dans âoutputâ vous mettez âCABLE Input (VB-Audio Virutal Cable)â. Sur discord, dans âVoix & VidĂ©oâ, vous mettez dans le pĂ©riphĂ©rique dâentrĂ©e âCABLE Output (VB-Audio Virtualâ. Essayez de voir si vous vous entendez, normalement, il y a de grandes chances pour que ce soit toujours saccadĂ©.
La derniĂšre Ă©tape, allez dans votre âGestionnaire des tĂąchesâ, puis dans âDĂ©tailsâ, puis dans audiodg.exe
. Vous faites clic droit sur audiodg.exe
, sur âDĂ©finir la prioritĂ©â, puis sur âHauteâ. Pour finir, faites clic droit encore une fois sur audiodg.exe
, puis âdĂ©finir lâaffinitĂ©â, puis cliquez sur la case âTous les processeursâ, et cliquez uniquement sur la case âUC 2â.
Voilà , votre problÚme est normalement réglé !