Использование в Lotus Notes однобайтовой и двухбайтовой кодировок

В Lotus Notes может храниться любая информация полях типа RichText. При использовании текстовой информации используется кодировка LMBCS. При этом один символ кодируется несколькими байтами: английские буквы - одним байтом, русские - двумя, китайские, японские, корейские - тремя... Внутри базы допускаются тексты, в которых рядом находятся и английская буква, и русская буква, и японский иероглиф. При выводе текстовой информации из баз на экран происходит перекодирование ее из LMBCS в кодировку, поддерживаемую машиной (native). Перекодировка ведется по таблицам .cls. При этом не на всех платформах такое преобразование может работать. Если какой-то символ из текста в базе по текущей таблице перекодировки не может быть сопоставлен символу в кодировке машины, он будет виден на экране на Windows-платформах как что-то среднее между мягким знаком и буквой Б, а в OS/2 - в виде полностью закрашенного квадрата.

Notes использует в качестве таблиц перекодировки файлы l_cpdos.cls, l_cpwin.cls - только Windows-подобные платформы, для сортировки - collstd.cls.

Lotus приняла соглашение о двухбайтовой кодировке русских букв только после того, как Notes стали применять в России. При установке английского клиента или сервера, символы с кодами от 128 до 255 по умолчанию соответствуют греческим буквам (такими их считает Notes), и Notes сортирует их по-гречески, но за счет русификатора и фонтов рисуются на экране как русские буквы.

В то время и другого то варианта не было, как установить продукт и выполнить копирование следующих файлов кодировки и сортировки. Файлы последней строки используется для правильного экспорта из Notes:

copy l_cp437.cls l_cpdos.cls

copy l_cp1252.cls l_cpwin.cls

copy collus.cls collstd.cls

copy l_cp1251.cls в l_cp1252.cls

При установке русского клиента копирование этих файлов происходит автоматически и Вам не нужно выполнять эту процедуру.

“В природе” известны также Киевские кодировки. При их использовании русские буквы в двухбайтовой кодировке и русские буквы в однобайтовой кодировке рустуются на экране нормально, но новая информация в базу пишется в двухбайтовой кодировке.

Содержание раздела