Modifier les accentués dans les noms de fichiers : Différence entre versions
De wikiGite
Ligne 1 : | Ligne 1 : | ||
Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8. | Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8. | ||
− | Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié | + | Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié le nom de ces répertoires ! Ensuite il refait une passe pour les fichiers. |
Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué. | Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué. |
Version du 17 janvier 2018 à 12:16
Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8.
Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié le nom de ces répertoires ! Ensuite il refait une passe pour les fichiers.
Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué.
#!/bin/bash
grep-invalid-utf8 () {
perl -l -ne '/^([\000-\177]|[\300-\337][\200-\277]|[\340-\357][\200-\277]{2}|[\360-\367][\200-\277]{3}|[\370-\373][\200-\277]{4}|[\374-\375][\200-\277]{5})*$/ or print'
}
IFS='
'
# first pass for renaming directories...
for file in `find /home -type d | grep-invalid-utf8`
do
filename=`basename "$file"`
dirname=`dirname "$file"`
newname=`echo $filename | iconv -f latin1 -t utf8`
# mv "$file" "$dirname/${newname}" # Rename and overwrite existing file with same name and correct accents
mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done
# ... then files in all directories renamed (or not)
for file in `find /home | grep-invalid-utf8`
do
filename=`basename "$file"`
dirname=`dirname "$file"`
newname=`echo $filename | iconv -f latin1 -t utf8`
# mv "$file" "$dirname/${newname}" # Rename and overwrite existing file with same name and correct accents
mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done