Posts Tagged ‘архив’

Решил порыться в том, с чем сталкивался пол-года назад. Вот например: берем из базы MySQL строку, и обрезаем ее до фиксированного кол-ва сиволов n. Все происходит в кодировке UTF-8. После урезки строки в конце появляется непонятный символ. Как убрать?

Итак, кириллица в UTF8 — достаточно двухбайтная :). И substr, в частности, обрезает симолвы непонятным нам образом (на самом деле, понятным, но не до конца).

Пол года назад я принял ламерское решение — укорчаивать строки в кодировке CP1251 и потом возвращаться в UTF8 готовую строку, если требуется. То есть что-то вроде:

echo iconvWINDOWS-1251«, «UTF-8«, substr(iconvUTF-8«, «WINDOWS-1251«, $string, 0, 40));

Думаю, разъяснять, что и как, не стоит. На такое мой мозг был способен пол года назад. Когда у меня перестанут появляться абсолютно идиотские решения (фактически, костыли)… я не знаю. 🙂

Реклама