JavaScript: Codepoint to Binary, Binary to Codepoint in UTF-8

Oktetten aus Codepoint berechnen und umgekehrt, zwischen String und ArrayBuffer vermitteln

Codepoint und Binary (Hexadezimal)
Berechnen Zeichen:

Über diese Anwendung

Mit der FileAPI machte es sich notwendig, JavaScript in Sachen Zeichenkodierung fit zu machen. So gibt es nun TextDecoder und TextEncoder als Äquivalent zum Perlmodul Encode was über die Kodierung zwischen Codepoint und Bytefolge vermittelt. Mit obenstehendem Formular können Sie sich das hinsichtlich UTF-8 veranschaulichen indem Sie z.B. als Codepoint BC eingeben, es ergibt sich die Bytefolge C2 BC und selbstverständlich funktioniert das auch mit mehreren Codepoints.

Hinweis: Zur Prüfung machen Sie die Rückrechnung!

Zeichenketten zwischen ArrayBuffer und String

Intern werden in JavaScipt Strings grundsätzlich als Zeichenketten mit einer bestimmten Zeichenkodierung betrachtet, i.d.R. lautet diese Kodierung UTF-8. Aufgrunddessen basiert die Längenangabe einer Zeichenkette auf der Anzahl der Zeichen und nicht etwa auf der Anzahl der Oktetten (Bytes). Anders ausgedrückt wird in JavaScript jedes Zeichen durch seinen Codepoint representiert. Zur Representation von Rohdaten und deren Transport hingegen gibt es in JS den ArrayBuffer. Soll eine in einem ArrayBuffer transportierte Bytefolge als String (UTF-8-kodierte Zeichenkette) sichtbar gemacht werden, ist der Algorithmus anzuwenden welcher zwischen Codepoint und Bytewertigkeiten vermittelt.


Datenschutzerklärung: Diese Seite dient rein privaten Zwecken. Auf den für diese Domäne installierten Seiten werden grundsätzlich keine personenbezogenen Daten erhoben. Das Loggen der Zugriffe mit Ihrer Remote Adresse erfolgt beim Provider soweit das technisch erforderlich ist. s​os­@rolf­rost.de