Immer dieser Aerger mit Umlauten – Vortrag am 12. Februar 2015

Hällo Wörld!

oder

Immer dieser ඀rger mit Umlauten

oder

Was Sie nie über Umlaute wissen wollten (aber eigentlich wissen sollten)


Vortrag von Martin Neitzel, Gärtner Datensysteme, Braunschweig
(Kontakt: neitzel [at] marshlabs.gaertner.de)
Format: 25-30min Vortrag + 25 Minuten Diskussion
Datum: 12.02.2015 19:15 Uhr
Ort: Ostfalia Campus, Gebäude C, Seminarraum 127, Robert-Koch-Platz 8A, 38440 Wolfsburg

Plakat für die Veranstaltung:
http://dl.dropbox.com/u/1829993/WOBLUG-Plakat.pdf
http://dl.dropbox.com/u/1829993/WOBLUG-Plakat.odt


Abstract:

Welche Puzzle-Teile müssen bei Linux für korrekte Umlaute alles richtig zusammenpassen? Wie überprüfe ich diese Einstellungen, und wie identifiziere ich „kaputte“ Texte? Wie mache ich kaputte Texte wieder heil?
Dieser Vortrag gibt Orientierung, wie man sich am besten durch den Dschungel der Encodings, Locales und Terminal-Einstellungen durchschlägt.

Shortpaper:

Umlaute gehen im Rechner kaputt, seitdem sie dort überhaupt gemacht werden können. Auch wenn die Einladung zur Geburtstagsfeier auf dem Bildschirm nach viel Gestaltung endlich perfekt erscheint: auf dem Drucker, in der verschickten Email, oder im Blog kann alles plötzlich etwas hässlicher aussehen.
Ich möchte insbesondere den Anwendern und Nicht-Technikern ohne Vorkenntnisse möglichst verständlich erklären, wie der Umgang mit Zeichensätzen von der Theorie her bei Linux sein sollte, und was praktisch dabei aber gelegentlich schief läuft.
In der Vortrags-Hälfte werde ich zeigen und erklären:

  1. Wie die Umlaute in den Rechner kommen.
  2. Eine kurze Übersicht über verschiedene Kodierungen, die generell in Gebrauch sind
  3. Was „locales“ sind, wie man sich für eine entscheidet, und was man dann alles dafür braucht und machen muss.
  4. Wie man weiterkommt, wenn andere Leute (bspw. die Online-Bank oder der Drucker-Hersteller) andere Kodierungen viel besser finden.

Dabei werde ich insgesamt ca. sechs (einfache) Linux-Kommandos zeigen.
Die Teilnehmer sollten hinterher fähig sein, die Einstellungen des eigenen Rechners anhand einer Checkliste herauszufinden, auf Korrektheit hin zu überprüfen und ggf. zu korrigieren. Auf dieser Grundlage können dann auch „andere“ Texte von Fremdsystemen ordentlich uebernommen und konvertiert werden.
In der Diskussions-Hälfte möchte ich in erster Linie auf Fragen zum praktischen Einsatz eingehen:

  • Was ist die aktuelle Verbreitung von Unicode/LATIN1?
  • Wie überlebe ich in einer gemischten Umgebung mit alten Datenbeständen und unterschiedlich (un)fähiger Software?
  • Wie setzt man wo wofür welche Umlaute am besten gar nicht erst ein?

Zum Referenten:

Martin Neitzel hat seine ersten Umlaute vor über 30 Jahren mit DIN-66003 und EBCDIC in die Rechner gekl|ppelt und m|chte eigentlich nicht mehr dahin zur}ck|||111!!
Seine Br"otchen verdient er seit 20 Jahren als ISP in einem t(:aglichen, endlosen, vergeblichen Kampf gegen PHP-Fuzzies, die gerne noch mal eine Extra-Schicht URL&&hyph;Encoding um UTF-Umlaute wickeln, bevor sie sie in eine LATIN1-Datenbank st඀pseln.