Bild

(Foto: pixabay.com)

Der lange Weg zu Unicode & Emojis

Es ist unglaublich, aber wahr: wer die Anfänge und Hintergründe zu Unicode und Emojis wirklich verstehen will, der muss in die Vergangenheit zu Zeiten des Wilden Westens vor mehr als 150 Jahren reisen.

... Bild Von Markus Fleschutz 🕓 1. Januar 2023

Telegraphen & Morsecode

Samuel Morse erfand 1837 einen einfachen elektromagnetischen Schreibtelegrafen und zusammen mit seinem Mitarbeiter Alfred Lewis Vail einen Code, der Zahlen und Buchstaben umfasste.

Dieser einfache Code besteht aus kurzen und langen Signalen (mit Pausen) und wurde ab 1844 betrieblich bei amerikanischen Eisenbahnen und den Telegrafieunternehmen eingesetzt. Noch heute ist der Morsecode in Luft- und Schifffahrt im Einsatz.

Morse

(Morse-Taster)

Fernschreiber & Baudot-Code

Mit dem Erfolg der Telegrafie wurde nach Möglichkeiten gesucht, mit weniger Personal mehr Informationen zu übertragen. Das gelang Jean-Maurice-Émile Baudot 1870 mit einem 5-Bit-Zeichencode und einem von ihm entwickelten Telegrafengerät.

Dadurch dass, anders als beim Morsecode, alle Zeichen durch einen Code gleicher Länge dargestellt wurden, war eine maschinelle Dekodierung deutlich einfacher zu realisieren und mit den zur Verfügung stehenden Mitteln machbar.

Zusammen mit Donald Murray wurde der Code an die Verwendung mit einer alphanumerischen Tastatur angepasst, diese fand als Fernschreiber im Telegrafen- und Telex-Betrieb weltweite Verwendung und wird auch als Baudot-Murray-Code oder Murray-Code bezeichnet.

Baudot-Code

(Lochstreifen mit 5-Bit-Baudot-Code)

Fernschreiber & ASCII-Code

Mit dem Erfolg der Fernschreiber kam der Wunsch auf, mehr als die 32 möglichen Zeichen bei 5 Bit verwenden zu können. Dazu wurde 1963 der 7-Bit-ASCII-Code (maximal 128 Zeichen, damals noch ohne Kleinbuchstaben) zuerst für bestimmte amerikanische Fernschreibermodelle eingeführt. 1968 wurde dann die heutige gültige Fassung des ASCII-Standards festgelegt.

Typetype Modell 33 ASR

(Teletype Modell 33 ASR mit ASCII-Zeichensatz)

Computer & ASCII-Code

In den Anfängen des Computerzeitalters entwickelte sich ASCII zum Standard-Code für Schriftzeichen. Computer arbeiten jedoch effizienter mit Bytes (8-Bit) statt mit 7-Bit, dadurch wurden Erweiterungen möglich wie zum Beispiel ISO 8859-1 für westeuropäische Sprachen oder der ANSI-Code (Windows-1252 Code).

DEC Terminal VT100

(DEC Terminal VT100 mit ASCII-Zeichensatz)

Computer & Unicode

Mit dem Erfolg von Computern kam die Notwendigkeit auf, unterschiedliche Zeichensätze für den internationalen Datenaustausch verwenden zu können.

Joseph D. Becker von Xerox schrieb 1988 den ersten Entwurf für einen universalen Zeichensatz. Im Gegensatz zu früheren Zeichenkodierungen, die meist nur ein bestimmtes Schriftsystem kodierten, ist es das Ziel von Unicode, alle in Gebrauch befindlichen Schriftsysteme und Zeichen zu kodieren.

Im Oktober 1991 wurde nach mehrjähriger Entwicklungszeit die Version 1.0.0 des Unicode-Standards veröffentlicht, die damals nur die europäischen, nahöstlichen und indischen Schriften kodierte. Dabei entsprechen die ersten 128 Unicode-Zeichen exakt dem ASCII-Standard, für die effiziente Speicherung und Übertragung hat sich mittlerweile UTF-8 durchgesetzt.

Mit Unicode 2.0 im Juli 1996 wurde der Standard von ursprünglich 65.536 auf die heutigen 1.114.112 Codepunkte erweitert.

Das gegenwärtige Unicode 15.0 von September 2022 umfasst jetzt 161 Schriftsysteme mit insgesamt 149.186 Zeichen.

Unicode

Computer, Handys & Emojis

Am Anfang war das Smiley: die ersten Strichgesichter bestanden aus der Verknüpfung von drei Zeichen auf der Computertastatur: Doppelpunkt, Gedankenstrich und runde Klammer zu ":-)". Zum Lesen muss man den Kopf seitwärts halten. Der US-amerikanische Informatikprofessor Scott E. Fahlman hatte diese Zeichen- und Buchstabenkombinationen im Jahr 1982 zur Kennzeichnung von Witzen vorgeschlagen und gilt damit als Erfinder der elektronischen Smileys.

Aus diesen Smileys entwickelten sich die Emojis (japanisch für "Bildschriftzeichen") um die eigene Laune, Gefühle und Stimmung auszudrücken.

Mit Unicode 6.0 im Oktober 2010 kamen erstmalig auch Emoji-Zeichen hinzu. Mittlerweile unterstützt Unicode 15.0 insgesamt 4.489 Emojis.

Smartphone Emojis

Quellenangaben

  1. https://de.wikipedia.org/wiki/Morsecode
  2. https://de.wikipedia.org/wiki/Baudot-Code
  3. https://de.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange
  4. https://de.wikipedia.org/wiki/Teletype_Modell_33
  5. https://de.wikipedia.org/wiki/ISO_8859-1
  6. https://de.wikipedia.org/wiki/ANSI-Zeichencode
  7. https://de.wikipedia.org/wiki/Unicode
  8. https://home.unicode.org