Projekt

Allgemein

Profil

Aktionen

GX-Task #40397

geschlossen

UTF-8-Erkennung kann performanter gelöst werden

Von Moritz Bunjes vor etwa 10 Jahren hinzugefügt. Vor etwa 7 Jahren aktualisiert.

Status:
Erledigt
Priorität:
Normal
Zugewiesen an:
Mirko Janssen
Kategorie:
Core
Zielversion:
% erledigt:

100%

Steps to reproduce:
Betroffene Versionen:
2.1.1.2
Release Notes Langtext:

UTF-8-Erkennung performanter gelöst


Beschreibung

In mehreren Scripten im Shop wird ein UTF-8-String mittels des regulären Ausdrucks

if(preg_match('/(?:[\xC2-\xDF][\x80-\xBF]|\xE0[\xA0-\xBF][\x80-\xBF]|[\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}|\xED[\x80-\x9F][\x80-\xBF]|\xF0[\x90-\xBF][\x80-\xBF]{2}|[\xF1-\xF3][\x80-\xBF]{3}|\xF4[\x80-\x8F][\x80-\xBF]{2})+/xs', $p_string))
{
$t_encoding = 'UTF-8';
}

erkannt. Dies soll auch so funktionieren (ungetestet, niedrigste PHP-Version beachten):

if(preg_match('//u', $p_string))
{
$t_encoding = 'UTF-8';
}


Aktionen

Auch abrufbar als: Atom PDF