Ermittele Codepoint und Unicode-Name eingegebener Zeichen mit PHP

Eine Anwendung meiner PHP-Library zum Zugriff auf die Unicode Character Database

Mit dieser kleinen Web-Anwendung zeige ich die einfache Verwendung meiner Unicode-Libraries die ich in PHP entwickelt habe.

Zurücksetzen

In PHP kommt die Eingabe als Bytesequenz an

Zunächst wird anhand der gesendeten Bytewertigkeiten geprüft, welche Bytes zu einem Zeichen gehörig sind. Gleichermaßen wird dabei der Codepoint für jedes sich dabei ergebende Zeichen berechnet, so ergibt sich aus der Benutzereingabe also ein Array mit Codepoints. Über dieses Array wird schließlich iteriert um die zu jedem Zeichen darzstellenen Werte zu berechnen, siehe Code untenstehend:

$ucd = new UnicodeData(array( 
    'dir' => $this->FILEDIR, 
    'idxfile' => 'UnicodeData.index',
    'ucdfile' => 'UnicodeData.txt'
));
$cop = new Codepoint;
$this->STASH['res'] = 1;
$this->STASH['characters'] = array();
foreach( $cop->codepoints( $this->param('chars') ) as $cp){
    $binary = $cop->binary(array($cp));
    $t = array();
    foreach( unpack("C*", $binary) as $b){
        array_push($t, sprintf("%02X", $b));
    }
    array_push($this->STASH['characters'], array(
        'ncr'       => sprintf("&#x%x;", $cp),
        'name'      => $ucd->charname($cp),
        'binary'    => join(" ", $t),
        'codepoint' => sprintf("%X", $cp)
    ));
}  

Schließlich wird $this->STASH über das HTML-Template gerendert, das ergibt die Tabelle die oben zu sehen ist.


Datenschutzerklärung: Diese Seite dient rein privaten Zwecken. Auf den für diese Domäne installierten Seiten werden grundsätzlich keine personenbezogenen Daten erhoben. Das Loggen der Zugriffe mit Ihrer Remote Adresse erfolgt beim Provider soweit das technisch erforderlich ist. s​os­@rolf­rost.de und wenn Sie möchten daß mein Prepaid nicht verfällt können Sie mich auch gerne anrufen 01625 26 40 76.