FAQ

Retrouvez ici les questions les plus fréquemment posées.

Notre serveur a été banni par Discord à cause de copyright il y a de cela quelques mois.

Nous travaillons actuellement sur un tout nouveau discord et une nouvelle documentation pour vous. Merci d'être patient, nous sommes de retour très bientôt.

Restez connecté sur notre compte X (Twitter) : https://x.com/AIHUBFRANCE

Index

La plupart des problèmes proviennent de Python :

  • Cliquez sur le bouton "Télécharger Python".

  • Une fois le téléchargement terminé, exécutez le fichier d'installation et suivez les instructions pour installer Python.

  • Pendant le processus d'installation, assurez-vous de cocher les cases à côté de "Ajouter Python au PATH" et "Installer IDLE".

Aussi, ne jamais utiliser de chemins avec des espaces ou des caractères spéciaux :

❌ D:\Test 1\IA ou D:\Test 1\L'IA

✅ D:\Test-1\IA ou D:\Test1\IA

Questions Générales

C'est quoi des "epochs"

Dans le contexte de l'entraînement d'un modèle, l'epoch est un terme utilisé pour référer à un passage complet du dataset. Généralement plusieurs centaines d'epoch sont nécessaire pour parvenir à un résulats satisfaisant. Bien qu'un plus grand nombre d'epoch soit souvent synonyme de meilleurs résultats, le surentraînement d'un modèle entraîne une baisse conséquente de la qualité. Il est donc conseillé de faire des tests régulier ou utiliser le tensorboard pour trouver la version optimale du modèle durant son entrainement.

C'est quoi le "pitch" ?

Le "pitch" en musique signifie si un son est élevé (comme le chant d'un oiseau) ou bas (comme un bruit de moteur). Cela ajoute de l'intérêt à la musique et aide à créer des mélodies.

Pour rendre la musique plus aiguë, augmente le pitch. Pour la rendre plus grave, baisse-le. C'est comme ajuster les notes d'une chanson pour exprimer différentes émotions et ambiances.

C'est quoi le "Feature Retrieval" ?

En gros c'est l'accent.

Pour en savoir plus : La récupération de caractéristiques fait généralement référence à l'extraction de certaines caractéristiques spécifiques d'un signal vocal ou d'un échantillon audio. Ces caractéristiques peuvent inclure des informations telles que le timbre, le rythme, le tempo, le volume, etc. Dans le contexte de RVC GUI, l'option de "feature retrieval" pourrait être utilisée pour extraire des caractéristiques spécifiques du signal vocal et potentiellement les modifier, amplifiant ainsi l'accent ou d'autres aspects du signal vocal.

C'est quoi "f0Detector" et lequel est le meilleur ?

Le choix du modèle "f0Detector" dépend de la manière dont vous comptez l'utiliser, que ce soit pour chanter, parler, rapper, etc. Voici des recommandations pour différents cas d'utilisation :

- RMVPE : Il offre une excellente qualité et est très performant, adapté à tout.

- Harvest : Convient aux conversations de base et au rap avec des tonalités plus basses.

- Dio : Convient aux conversations de base et au rap avec des tonalités moyennes/élevées.

- Crepe / Crepe-full : Recommandés pour parler et chanter avec diverses tonalités.

- Crepe-tiny : Une version plus rapide et moins gourmande en puissance de traitement du modèle Crepe, idéale pour de nombreux usages.

Sélectionnez le modèle en fonction de vos besoins spécifiques pour obtenir les meilleurs résultats possibles avec la conversion vocale.

Questions sur les Guides clone de voix

FileNotFoundError

Cette erreur se produit car vous n'avez pas ajouté le chemin d'accès au répertoire runtime/scripts d'Applio-RVC-Fork à la variable PATH de Windows. Pour ce faire, vous devez modifier les variables d'environnement et ajouter le chemin d'accès au répertoire Applio-RVC-Fork/runtime/scripts en haut de la liste.

Suivez ces étapes :

  1. Accédez aux paramètres système avancés :

    • Dans la barre de recherche de Windows, saisissez "Paramètres système avancés". La fenêtre Propriétés du système s'ouvrira.

  2. Variables d'environnement :

  3. Modifier les variables d'utilisateur ou du système (selon votre préférence) :

    • Dans la fenêtre Variables d'environnement, vous verrez deux sections : "Variables utilisateur" et "Variables système".

    • Si vous souhaitez que la modification soit disponible uniquement pour votre compte utilisateur, modifiez les "Variables utilisateur". Si vous souhaitez que la modification soit appliquée globalement pour tous les utilisateurs, modifiez les "Variables système". Notez que la modification des variables système nécessite généralement des privilèges d'administrateur.

  4. Modifier la variable PATH :

    • Dans la section appropriée (Utilisateur ou Système), localisez la variable "Path" dans la liste des variables et sélectionnez-la.

  5. Ajouter le chemin d'accès au répertoire Runtime d'Applio-RVC-Fork :

    • Par exemple, si le chemin est C:\Program Files\Applio-RVC-Fork\runtime\scripts, vous ajouterez ce chemin à la liste.

  6. Déplacer le chemin ajouté en haut de la liste :

    • Il est important de placer le chemin nouvellement ajouté en haut de la liste pour qu'il ait la priorité sur d'autres chemins conflictuels.

  7. Appliquer les modifications et fermer :

  8. Réouvrir l'invite de commandes :

    • Pour vous assurer que les modifications prennent effet, vous devrez peut-être rouvrir le fichier go-applio.bat qui était ouvert avant d'effectuer ces modifications.

La variable PATH inclura désormais le chemin d'accès au répertoire Applio-RVC-Fork/runtime/scripts en haut de la liste, et vous ne devriez plus rencontrer l'erreur de fichier introuvable lors de l'exécution d'Applio !

Quels réglages devrais-je utiliser si la voix est plutôt grave ou plutôt aiguë ?

Cela dépend du son; vous devez expérimenter et ajuster en fonction des accents, des voix, des respirations, etc. Prenez votre temps, expérimentez et écoutez progressivement pour trouver les réglages adéquats.

Quels sont les GPU recommandés pour réaliser du clonage vocal ?

Aucune pour

  1. NVIDIA GeForce RTX 30xx Series (par exemple, RTX 3090, RTX 3080)

  2. NVIDIA GeForce RTX 20xx Series (par exemple, RTX 2080 Ti, RTX 2070)

  3. NVIDIA Quadro Series (pour des performances professionnelles)

  4. NVIDIA Tesla Series (pour des charges de travail intensives en IA)

  5. NVIDIA A100 (pour des tâches intensives en IA et des performances extrêmes)

  6. AMD Radeon Instinct Series (pour des tâches professionnelles)

Cependant, il est important de noter que les performances en matière de clonage vocal dépendent également du logiciel que vous utilisez. Certains logiciels de clonage vocal peuvent tirer parti des spécificités de certaines cartes graphiques ou d'autres accélérateurs matériels. Avant d'acheter une carte graphique pour le clonage vocal, vérifiez les recommandations spécifiques du logiciel que vous utilisez.

J'ai toujours des erreurs "No module named". Que faire ?

Déjà :

pip install -r Requirements.txt

Sinon :

Si vous continuez à obtenir des erreurs "No module named", cela signifie que Python ne peut pas trouver certaines bibliothèques. Voici comment résoudre cela :

  • Identifiez le nom du module manquant dans le message d'erreur.

  • Exécutez la commande suivante pour installer le module manquant (remplacez "nom du module" par le nom réel du module) :

Copy codepip install "nom du module"

Répétez cette étape pour chaque module manquant jusqu'à ce que toutes les erreurs disparaissent.

Si rien ne fonctionne supprimer tout et reinstaller.

Plutôt GPU ou CPU

GPU: Plus Rapide

CPU: Moins Rapide

Questions sur les Guides création de modèle

Lorsque je fais CTRL + B sur Audacity, rien ne se passe.

Allez dans "Édition" > "Préférences" > "Clavier" > Recherche : "Placer un repère à la sélection" et changez la touche.

C'est quoi un "dataset"

Un dataset, en français "ensemble de données", est une collection structurée de données qui sont généralement organisées en tableaux, listes, fichiers ou d'autres formats similaires. Ces données peuvent être de nature variée, telles que des chiffres, des textes, des images, des vidéos, etc. Pour crée des voix les données seront des audio.

Que dois-je faire à l'étape "Enter the path of the audio file to be processed" (par défaut, il y a un exemple au bon format) ?

À cette étape, vous devez indiquer le chemin d'accès complet vers le fichier audio que vous souhaitez traiter à partir de votre ordinateur local. Vous pouvez le faire en copiant le chemin d'accès au fichier audio. Assurez-vous que le fichier audio se trouve dans un dossier accessible depuis votre ordinateur, car c'est à partir de ce chemin que le programme accédera au fichier pour le traitement. Si vous rencontrez des erreurs, veuillez les partager afin que nous puissions vous aider à les résoudre.

Plutôt GPU ou CPU

GPU: Plus Rapide

CPU: Moins Rapide

J'ai toujours des erreurs "No module named". Que faire ?

Déjà :

pip install -r Requirements.txt

Sinon :

Si vous continuez à obtenir des erreurs "No module named", cela signifie que Python ne peut pas trouver certaines bibliothèques. Voici comment résoudre cela :

  • Identifiez le nom du module manquant dans le message d'erreur.

  • Exécutez la commande suivante pour installer le module manquant (remplacez "nom du module" par le nom réel du module) :

Copy codepip install "nom du module"

Répétez cette étape pour chaque module manquant jusqu'à ce que toutes les erreurs disparaissent.

Si rien ne fonctionne supprimer tout et reinstaller.

Questions sur les Autres Guides

Plutôt GPU ou CPU

GPU: Plus Rapide

CPU: Moins Rapide

Questions sur le Voice Changer en Temps Réel :

Quels réglages devrais-je utiliser si la voix est plutôt grave ou plutôt aiguë ?

Cela dépend du son; vous devez expérimenter et ajuster en fonction des accents, des voix, des respirations, etc. Prenez votre temps, expérimentez et écoutez progressivement pour trouver les réglages adéquats.

J'obtiens le message d'erreur : "No such file or directory."

Ce message d'erreur indique généralement que le fichier ou le dossier spécifié n'existe pas dans le chemin que vous avez indiqué. Assurez-vous que le chemin du fichier est correct et que le fichier ou le dossier que vous essayez d'accéder existe bel et bien. Si le fichier se trouve dans un autre emplacement, veuillez spécifier le chemin correct.

On ne m'entend pas quand j'ai le Voice Changer Realtime

Sur le logiciel du Voice Changer:

  1. Sélectionnez votre microphone principal pour l'entrée.

  1. Sélectionnez le périphérique audio VB-Cable : « [MME] CABLE Input (VB-Audio Virtual Cable) » pour la sortie.

  1. Utilisez le moniteur pour écouter l'audio de sortie. Sélectionnez votre casque.

Assurez-vous que votre casque est correctement configuré comme périphérique de sortie par défaut dans les paramètres système.

Sur un autre logiciel:

Si vous utilisez d'autres logiciels tels que Discord, configurez-les comme suit :

Pour l'entrée, sélectionnez « CABLE Output ».

Pour la sortie, choisissez votre casque.

Je saccade/la voix est horrible avec le Voice Changer Realtime

Tout d'abord, passez par VB-Audio Cable, je trouve que c'est plus simple que Voicemeeter, donc ce tuto sera uniquement pour VB Audio. Le lien si jamais vous voulez le télécharger : https://vb-audio.com/Cable/

Vous le téléchargez sur Windows ou Mac selon sur quoi vous êtes. Une fois téléchargé, vous allez exécuter VBCABLE_Setup en administrateur, si rien ne s'ouvre, faites pareil avec VBCABLE_Setup_x64 (en administrateur aussi). Lorsque l'application s'ouvre, installez-la et redémarrez votre pc.

Une fois le redémarrage effectué, ouvrez RVC, et en bas à gauche, dans la catégorie "AUDIO", dans "output" vous mettez "CABLE Input (VB-Audio Virutal Cable). Sur discord, dans "Voix & Vidéo", vous mettez dans le périphérique d'entrée "CABLE Output (VB-Audio Virtual". Essayez de voir si vous vous entendez, normalement, il y a de grandes chances pour que ce soit toujours saccadé.

La dernière étape, allez dans votre "Gestionnaire des tâches", puis dans "Détails", puis dans "audiodg.exe". Vous faites clic droit sur "audiodg.exe", sur "Définir la priorité", puis sur "Haute". Pour finir, faites clic droit encore une fois sur "audiodg.exe", puis "définir l'affinité", puis cliquez sur la case "Tous les processeurs", et cliquez uniquement sur la case "UC 2".

Voilà, votre problème est normalement réglé !

Comment utiliser l'IA sur d'autre logiciel ?

Pour l'entrée, sélectionnez « CABLE Output ».

Pour la sortie, choisissez votre casque

Dernière mise à jour