Modifier les accentués dans les noms de fichiers
De wikiGite
Révision datée du 17 janvier 2018 à 11:57 par Frank (discussion | contributions)
Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8.
Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié les noms du répertoires ! Ensuite il refait une passe pour les fichiers.
Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué.
#!/bin/bash
grep-invalid-utf8 () {
perl -l -ne '/^([\000-\177]|[\300-\337][\200-\277]|[\340-\357][\200-\277]{2}|[\360-\367][\200-\277]{3}|[\370-\373][\200-\277]{4}|[\374-\375][\200-\277]{5})*$/ or print'
}
IFS='
'
# first pass for renaming directories...
for file in `find /home -type d | grep-invalid-utf8`
do
filename=`basename "$file"`
dirname=`dirname "$file"`
newname=`echo $filename | iconv -f latin1 -t utf8`
# mv "$file" "$dirname/_${newname}" # Rename and overwrite existing file with same name and correct accents
mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done
# ... then files in all directories renamed (or not)
for file in `find /home | grep-invalid-utf8`
do
filename=`basename "$file"`
dirname=`dirname "$file"`
newname=`echo $filename | iconv -f latin1 -t utf8`
mv "$file" "$dirname/_${newname}"
done