www.textpattern.ru

Статьи и Документация

Транслитерация кириллицы в латинницу

Так как Textpattern для ссылок (урлов) на страницы статей использует название статьи, и при использования кириллицы в этом названии (а куда нам деваться, мы же пишем по-русски?) возникают проблемы, приходится применять какой-нибудь способ замещения кириллицы в урлах на латинницу.

Надо отметить сразу – способов такого замещения может быть великое множество. Каждый может создать свою систему замены, можно даже что-нибудь с псевдоинтеллектом замутить, если оно кому надо.
Но у нас стоит задача попроще.

Нам надо каким-то образом произвести однозначную замену символов, во избежании недоразумений. Для этого хотелось бы использовать некое стандартное решение (не одним днем живем), а не придумывать очередной эксклюзив.
Я решил поискать такие решения в Интернете.

И с удивлением обнаружил, что этот вопрос не так прост, как казалось бы.

Начать надо с того, что в бывшем Советском Союзе был ГОСТ 16876-71, который назывался “Правила транслитерации букв кириллического алфавита буквами латинского алфавита.” Судя по последним двум цифрам – разработан в 1971 году.

Впоследствии, этот ГОСТ был несколько изменен, и стал стандартом бывших стран СЭВ 1362-78. Разработчики нашего ГОСТ, видимо, изначально не учли, что кроме русскоязычного населения кириллицу используют украинцы, белорусы, болгары, монголы, македоняне и сербохорваты. Впрочем, изменения коснулись одной буквы ‘Й’ (и краткой).

Удивительно то, что и этот стандарт планировалось модифицировать. Сейчас уже трудно сказать, с чем это было связано, но на гост.ру мы видим, что он модифицируется, и окончательная сдача у разработчиков этой модификации назначена на январь 1999 года.
Затянулось.
Бывает.

Тем временем, МВД РФ издает приказ от 26.09.1996 года “О ПОРЯДКЕ РЕГИСТРАЦИИ ТРАНСПОРТНЫХ СРЕДСТВ”, где в приложении N 7 публикует “ТАБЛИЦУ СООТВЕТСТВИЯ РУССКИХ И ЛАТИНСКИХ БУКВ”, которая, разумеется, отличается от двух предыдущих стандартов.

Между тем, по другую сторону океана, американцы, похоже, тоже запарились сталкиваться с неоднозначностью транслитерации кириллицы в латинницу (а что им оставалось делать, у них же кроме английских – других букв нет на клавиатурах :-)).
Но, то ли они слыхом не слыхивали о наших ГОСТах, то ли решили, что у нас интеллекта маловато, то ли по каким другим причинам, но решили создать свои системы перекодировок.

В первую очередь кому это понадобилось, была The Library of Congress – Библиотека Конгресса США (почитывали, почитывали в американском конгрессе книги русских писателей и видимо авторов книг просто жизненно надо было упорядочить в своих хранилищах), совместно с American Library Association, и, почему-то, не удовлетворившись работой соотечественников, свою перекодировку создала The United States Board on Geographic Names (BGN) – организация, стандартизирующая географические наименования для использования в публикациях парламента США.

Вы думаете это все? Нет.
Загадочный русский язык продолжает волновать умы человечества.
Усилий одной державы уже не хватает для того, чтобы этим 33 буквам найти достойные аналоги и поэтому, объединившись, ученые США и Великобритании (British Standard Institute (UK) & ISI – Institute for Scientific Information (USA)) создают так называемый стандарт BSI.

Это я упомянул только про англоговорящие страны.
Как вы уже, наверно, догадались, в странах, у которых родным языком является не английский (Германия,Франция), разработаны свои таблицы соответствия кириллицы и латинницы.

Волосы втают дыбом!
И это при том, что на 2 буквы – твердый знак и мягкий знак все уже давно махнули рукой, либо полностью пропуская их, либо стыдливо заменяя апострофом или кавычкой.

Вышеприведенные стандарты для наглядности сведем в таблицу.
Таблица расположена здесь

Продолжение исследования и определение оптимальной таблицы для транслита русских букв в литинские приведено в обсуждении на форуме.

Обсуждение этой темы в форуме

 
Rambler's Top100