[kde-russian] Unicode

Alexander Dymo =?iso-8859-1?q?cloudtemple_=CE=C1_mksat=2Enet?=
Пн Мар 29 23:49:25 MSD 2004


On Monday 29 March 2004 19:36, Nick Shaforostoff wrote:
> В сообщении от Понедельник, 29-Мар-2004 18:38 Alexander Dymo написал
> Собственно, почему мы используем koi, cp1251 или utf.
Если говорить конкретно про мое предыдущее письмо ;) то так KMail 
захотел при включенной настройке сохранять по возможности кодировку
письма на которое отвечаешь. Что интересно, он упорно не желает создавать
письма в кодировке win-1251 в ответ на письмо с комбинацией
windows-1251 и us-ascii и использует utf-8. 

> погуглил, оказалось utf-кодировки на самом деле 9-битные (или ещё больше,
> но только, похоже, при использовании китайского).
utf-8:
латинский текст - 1 байт на символ
русский текст - 2 байта на символ
тайский текст :) - 3 байта на символ

> в последнем написано, что русские на хотят переходить с koi на utf
> но ответа на (самый главный (почему) вопрос, я так и не нашёл :-(
> ни cyrillic howto, ни man 7 utf8 не говорят ничего внятного по поводу
> unicode.
> так что, дело в привычке и экономии 1-го бита?
Русские символы двухбайтные в utf-8, а куча древних программ использующих
древние библиотеки для работы с символьной информацией все еще могут
неправильно интерпретировать такую двухбайтную информацию (т.е. если тупо
в программе на С считать в char[] строку из файла, то никакая локаль не
поможет такой программе правильно найти, например, вхождение регулярного
выражения).

PS: ну а пользователям KDE,вообще-то говоря, ru_RU.UTF-8 - то
что доктор прописал ;)

-- 
Alexander Dymo
ICST Department, National University of Shipbuilding, Mykolayiv, Ukraine




Подробная информация о списке рассылки kde-russian