22 Voix

Réparer des Fichiers Texte avec des Sauts de Ligne Mixtes

Tutoriel de Stefan Trost | 11/04/2022 à 20:12

Habituellement, les fichiers texte contiennent des caractères uniformes pour les pauses de ligne. Typiquement, ce sont les caractères CR LF (#0D #0A) dans des fichiers texte créés sous Windows ou le caractère LF (#0A) dans des fichiers texte stockés sur un système Linux, macOS ou d'un autre système Unix.

Cependant, il peut être compliqué si plusieurs caractères de saut de ligne apparaissent dans un fichier. Une des raisons pour cela peut être, par exemple, que plusieurs fichiers texte provenant de différents systèmes ont été rejoints sans faire attention aux sauts de la ligne utilisées précédemment.

Dans ce tutoriel, je voudrais donc vous montrer comment traiter ces fichiers et vous montrer un moyen de réparer les fichiers. Nous utilisons le programme TextEncoder pour cela avec lequel le type de saut de ligne de fichiers texte peut être modifié.

  1. Tout d'abord, nous ouvrons les fichiers texte affectés dans le TextEncoder. Pour cela, les fichiers en question peuvent être facilement déplacés sur le programme. Tout nombre de fichiers peut être édité simultanément.
  2. Ensuite, nous activons l'option "Sauts de Ligne" sur le côté droit sous "Changements".
  3. Sous nous choisissons sous "Lire comme" l'option "Saut de Ligne à chacun de ces Points de Code" dans la zone déroulante. Dans la zone de texte ci-dessous, nous entrons tous les points de code de tous les types de saut de ligne à laquelle une pause de ligne doit être réalisée. Par exemple, si nous avons un fichier texte dans lequel les trois types de saut de ligne CR LF (#0A #0A), LS (#2028) et l'onglet (#09) se produisent, nous pouvons entrer ces sauts de la ligne des virgules séparées comme suit: " #0A#0A,#2028,#09". Sous cette liste, vous trouverez d'autres explications concernant cette option.
  4. Dans la zone déroulante sous "Sauver sous", nous sélectionnons le type de saut de ligne uniforme, que nous souhaitons utiliser pour notre fichier. Par exemple, le type de ligne Windows CR LF.
  5. Maintenant, nous pouvons définir dans les "Options de Sauvegarde" si nous souhaitons remplacer nos fichiers d'origine ou souhaitez enregistrer les fichiers convertis sous un nouveau nom.
  6. Ensuite, nous pouvons cliquer sur "Convertir et Sauver" pour effectuer la conversion de tous les fichiers de la liste. Les trois types de sauts de ligne spécifiés sont normalisés et convertis en une ligne de saut de ligne uniforme du type CR LF.

Les points de code dans le champ "Saut de Ligne à chacun de ces Points de Code" peuvent être définis de différentes manières. Dans l'exemple ci-dessus, nous utilisons la notation hexadécimale (par exemple #0A#0A). De même, la notation décimale (13 10) est possible ou la forme U+000D U+000A. Tous ces types d'écriture peuvent être mélangés arbitrairement.

De plus, nous ne sommes pas obligés de définir les caractères du saut de ligne sous forme de points de code. Dans l'exemple, nous ne l'avons fait que parce que nous travaillons avec des caractères non visibles. Toutefois, si nous voulons lire un fichier avec des caractères de saut de ligne lisibles, nous pouvons également sélectionner l'option "Saut de Ligne à chacun de ces caractères" et définir les caractères directement. Par exemple, "a,b" lorsque les lettres "a" et "b" sont nos sauts de ligne ou ",",";" lorsque les lignes sont limitées par une virgule ou un point-virgule.

Conversion via la Ligne de Commande

Les explications précédentes décrivent la procédure de conversion via l'interface utilisateur graphique. Avec la version de lot du TextEncoder, une conversion de fichiers texte est également possible via la ligne de commande ou via un script.

L'exemple de ci-dessus ressemble à ce qui suit lors de la mise en œuvre via un appel de la ligne de commande et de convertir le fichier test.txt:

TextEncoder.exe -cl test.txt lb-read=customcps-#0D#0A,#2028,#09 lb=crlf

Nous utilisons le paramètre lb-read avec la valeur customcps-#0D#0A,#2028,#09 pour contrôler la lecture du fichier et le paramètre lb=crlf pour réaliser le stockage avec le type de saut de ligne CR LF. Au lieu de customcps, nous pouvons également utiliser le paramètre customstrs de la même manière lorsque des caractères lisibles sont utilisés comme signes de saut de ligne. Par exemple, lb-read=customstrs-a,b pour "a" et "b" en tant que lettres pour les sauts de ligne.

Une explication de tous les paramètres de la version du lot peut être trouvée ici.

Changement du Type de Saut de Ligne à l'Aide du TextConverter

Toutes les fonctions introduites dans ce didacticiel, y compris les fonctions de ligne de commande, peuvent également être appliquées avec le TextConverter. Avec le TextEncoder utilisé ici, seul le type de saut de ligne ou le codage des fichiers peut être modifié. Avec le TextConverter, vous pouvez également modifier le contenu des textes et des fichiers.

RépondrePositifNégatif

Sur l’Auteur

AvatarVous pouvez trouver des logiciels de Stefan Trost sur fr.sttmedia.com. Avez-vous besoin d'un logiciel personnalisé selon vos propres besoins? Écrivez-nous: fr.sttmedia.com/contact
Voir Profil

 

Sujets Connexes

VirtualBox: Changer la Date et l'Heure

Tutoriel | 10 Commentaires

MySQL: Sauts de Ligne dans MySQL

Conseil | 0 Commentaires

Avis Important

Veuillez noter: Les contributions publiées sur askingbox.com sont des contributions d’utilisateurs et ne doivent pas remplacer les conseils d’un professionnel. Ils ne sont pas vérifiés par des indépendants et ne reflètent pas nécessairement l’opinion de askingbox.com. Apprendre encore plus.

Participer

Posez votre propre question ou écrivez votre propre article sur askingbox.com. Voici comment.