Oktetten aus Codepoint berechnen und umgekehrt, zwischen String und ArrayBuffer vermitteln
Mit der FileAPI machte es sich notwendig, JavaScript in Sachen Zeichenkodierung fit zu machen. So gibt es nun TextDecoder
und TextEncoder
als Äquivalent zum Perlmodul Encode
was über die Kodierung zwischen Codepoint und Bytefolge vermittelt. Mit obenstehendem Formular können Sie sich das hinsichtlich UTF-8 veranschaulichen indem Sie z.B. als Codepoint BC
eingeben, es ergibt sich die Bytefolge C2 BC
und selbstverständlich funktioniert das auch mit mehreren Codepoints.
Hinweis: Zur Prüfung machen Sie die Rückrechnung!
Intern werden in JavaScipt Strings grundsätzlich als Zeichenketten mit einer bestimmten Zeichenkodierung betrachtet, i.d.R. lautet diese Kodierung UTF-8. Aufgrunddessen basiert die Längenangabe einer Zeichenkette auf der Anzahl der Zeichen und nicht etwa auf der Anzahl der Oktetten (Bytes). Anders ausgedrückt wird in JavaScript jedes Zeichen durch seinen Codepoint representiert. Zur Representation von Rohdaten und deren Transport hingegen gibt es in JS den ArrayBuffer. Soll eine in einem ArrayBuffer transportierte Bytefolge als String (UTF-8-kodierte Zeichenkette) sichtbar gemacht werden, ist der Algorithmus anzuwenden welcher zwischen Codepoint und Bytewertigkeiten vermittelt.
Datenschutzerklärung: Diese Seite dient rein privaten Zwecken. Auf den für diese Domäne installierten Seiten werden grundsätzlich keine personenbezogenen Daten erhoben. Das Loggen der Zugriffe mit Ihrer Remote Adresse erfolgt beim Provider soweit das technisch erforderlich ist. sos@rolfrost.de.