Outils personnels

Modifier les accentués dans les noms de fichiers

De wikiGite

Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8.

Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié le nom de ces répertoires ! Ensuite il refait une passe pour les fichiers.

Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué.

#!/bin/bash

grep-invalid-utf8 () {
  perl -l -ne '/^([\000-\177]|[\300-\337][\200-\277]|[\340-\357][\200-\277]{2}|[\360-\367][\200-\277]{3}|[\370-\373][\200-\277]{4}|[\374-\375][\200-\277]{5})*$/ or print'
}

IFS='
'
# first pass for renaming directories...
for file in `find /home -type d | grep-invalid-utf8`
do
   filename=`basename "$file"`
   dirname=`dirname "$file"`
   newname=`echo $filename | iconv -f latin1 -t utf8`
   # mv "$file" "$dirname/${newname}" # Rename and overwrite existing file with same name and correct accents
   mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done

# ... then files in all directories renamed (or not)
for file in `find /home | grep-invalid-utf8`
do
   filename=`basename "$file"`
   dirname=`dirname "$file"`
   newname=`echo $filename | iconv -f latin1 -t utf8`
   # mv "$file" "$dirname/${newname}" # Rename and overwrite existing file with same name and correct accents
   mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done