Outils personnels

Modifier les accentués dans les noms de fichiers : Différence entre versions

De wikiGite

Ligne 1 : Ligne 1 :
 
Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8.
 
Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8.
  
Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié les noms du répertoires ! Ensuite il refait une passe pour les fichiers.
+
Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié le nom de ces répertoires ! Ensuite il refait une passe pour les fichiers.
  
 
Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué.
 
Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué.

Version du 17 janvier 2018 à 12:16

Le script suivant permet de trouver les noms de fichiers ou répertoires avec des caractères accentués non reconnus (ce qui apparaît comme "?" ou "é"), et de les remplacer par des accents en UTF-8.

Une première passe s'occupe des noms de répertoires, sinon le script ne trouverait plus les fichiers à l'intérieur une fois qu'il a lui-même modifié le nom de ces répertoires ! Ensuite il refait une passe pour les fichiers.

Ici, on a choisit de modifier le nom en le faisant précéder d'un "_", afin d'être sûr de ne pas écraser un fichier qui aurait été auparavant manuellement dupliqué avec les bon accentué.

#!/bin/bash

grep-invalid-utf8 () {
  perl -l -ne '/^([\000-\177]|[\300-\337][\200-\277]|[\340-\357][\200-\277]{2}|[\360-\367][\200-\277]{3}|[\370-\373][\200-\277]{4}|[\374-\375][\200-\277]{5})*$/ or print'
}

IFS='
'
# first pass for renaming directories...
for file in `find /home -type d | grep-invalid-utf8`
do
   filename=`basename "$file"`
   dirname=`dirname "$file"`
   newname=`echo $filename | iconv -f latin1 -t utf8`
   # mv "$file" "$dirname/${newname}" # Rename and overwrite existing file with same name and correct accents
   mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done

# ... then files in all directories renamed (or not)
for file in `find /home | grep-invalid-utf8`
do
   filename=`basename "$file"`
   dirname=`dirname "$file"`
   newname=`echo $filename | iconv -f latin1 -t utf8`
   # mv "$file" "$dirname/${newname}" # Rename and overwrite existing file with same name and correct accents
   mv "$file" "$dirname/_${newname}" # Rename but be sure to never overwrite an existing file by adding a leading "_"
done