Change the Encoding of Text Files

From macwrench

Um die Zeichenkodierung von Textdateien (beispielsweise UTF-8 oder ISO Latin-1) zu konvertieren, genügt folgende Zeile im Terminal:

iconv -f QUELLKODIERUNG -t ZIELKODIERUNG QUELLDATEI > ZIELDATEI

beispielsweise um ein russisches (kyrillisches) Textfile in UTF-8 umzuwandeln:

iconv -f WINDOWS-1251 -t UTF-8 text.txt > text-utf8.txt

Alternativ kann natürlich auch der Texteditor des Vertrauens dazu verwendet werden, allerdings ist imho eine Zeile im Terminal schneller eingetippt als man durch ein seitenlanges Menü verschiedener Textkodierungen gescrollt hat ...

Unterstützte Kodierungen[edit]

Im Folgenden ein kleiner Auszug aus der Liste der von iconv unterstützten Kodierungen. Über die Option -l oder --list kann man sich eine Liste aller unterstützter Kodierungen ausgeben lassen, weitere Informationen dazu sind auch in der Manpage von iconv zu finden.

Die in einer Zeile stehenden Kodierungen sind dabei geleichbedeutend (alternative Schreibweisen und Bezeichnungen)

Unicode
UTF-8, UTF8
UTF-8-MAC, UTF8-MAC
UTF-16
UTF-16BE
UTF-16LE
UTF-32
UTF-32BE
UTF-32LE
UTF-7
ISO
CP819, IBM819, ISO8859-1, ISO_8859-1, ISO_8859-1:1987, L1, LATIN1, CSISOLATIN1
ISO-8859-2, ISO-IR-101, ISO8859-2, ISO_8859-2, ISO_8859-2:1987, L2, LATIN2, CSISOLATIN2
ISO-8859-3, ISO-IR-109, ISO8859-3, ISO_8859-3, ISO_8859-3:1988, L3, LATIN3, CSISOLATIN3
ISO-8859-4, ISO-IR-110, ISO8859-4, ISO_8859-4, ISO_8859-4:1988, L4, LATIN4, CSISOLATIN4
CYRILLIC, ISO-8859-5, ISO-IR-144, ISO8859-5, ISO_8859-5, ISO_8859-5:1988, CSISOLATINCYRILLIC

Siehe auch[edit]