Textpattern - на русском языке

форум общения русскоязычных пользователей CMS Текстпаттерн

Вы не зашли.

#1 20-05-2005 15:52:49

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Транслитерация. Кириллица и латинница. Изучение вопроса.

Так как Textpattern для ссылок (урлов) на страницы статей использует название статьи,
и при использования кириллицы в этом названии (а куда нам деваться, мы же пишем по-русски?)
возникают проблемы, приходится применять какой-нибудь способ замещения кириллицы в урлах на латинницу.
Надо отметить сразу - способов такого замещения может быть великое множество.
Каждый может создать свою систему замены, можно даже что-нибудь с псевдоинтеллектом замутить, если оно кому надо.
Но у нас стоит задача попроще.
Нам надо каким-то образом произвести однозначную замену символов, во избежании недоразумений.
Для этого хотелось бы использовать некое стандартное решение (не одним днем живем), а не придумывать очередной эксклюзив.
Я решил поискать такие решения в Интернете.

И с удивлением обнаружил, что этот вопрос не так прост, как казалось бы.

Начать надо с того, что в бывшем Советском Союзе был ГОСТ 16876-71,
который назывался "Правила транслитерации букв кириллического алфавита буквами латинского алфавита."
Судя по последним двум цифрам - разработан в 1971 году.

Впоследствии, этот ГОСТ был несколько изменен, и стал стандартом бывших стран СЭВ 1362-78.
Разработчики нашего ГОСТ, видимо, изначально не учли, что кроме русскоязычного населения кириллицу используют украинцы,
белорусы, болгары, монголы, македоняне и сербохорваты. Впрочем, изменения коснулись одной буквы Й (и краткой).

Удивительно то, что и этот стандарт планировалось модифицировать. Сейчас уже трудно сказать, с чем это было связано,
но на гост.ру
мы видим, что он модифицируется, и окончательная сдача у разработчиков этой модификации назначена на январь 1999 года.

Затянулось. Бывает.

Тем временем, МВД РФ издает приказ от 26.09.1996 года "О ПОРЯДКЕ РЕГИСТРАЦИИ ТРАНСПОРТНЫХ СРЕДСТВ", где в приложении N 7
публикует "ТАБЛИЦУ СООТВЕТСТВИЯ РУССКИХ И ЛАТИНСКИХ БУКВ", которая, разумеется, отличается от двух предыдущих стандартов.

Между тем, по другую сторону океана, американцы, похоже, тоже запарились сталкиваться с неоднозначностью транслитерации кириллицы в латинницу (а что им оставалось делать, у них же кроме английских - других букв нет на клавиатурах :-)).
Но, то ли они слыхом не слыхивали о наших ГОСТах, то ли решили, что у нас интеллекта маловато, то ли по каким другим причинам,
но решили создать свои системы перекодировок.
В первую очередь кому это понадобилось, была The Library of Congress - Библиотека Конгресса США (почитывали, почитывали в американском конгрессе книги русских писателей и видимо авторов книг просто жизненно надо было упорядочить в своих хранилищах),
совместно с American Library Association,
и, почему-то, не удовлетворившись работой соотечественников, свою перекодировку создала The United States Board on Geographic Names (BGN) -
организация, стандартизирующая географические наименования для использования в публикациях парламента США.

Вы думаете это все? Нет. Загадочный русский язык продолжает волновать умы человечества.
Усилий одной державы уже не хватает для того, чтобы этим 33 буквам найти достойные аналоги и поэтому,
объединившись, ученые США и Великобритании (British Standard Institute (UK) & ISI - Institute for Scientific Information (USA))
создают так называемый стандарт BSI.

Это я упомянул только про англоговорящие страны.
Как вы уже, наверно, догадались, в странах, у которых родным языком является не английский (Германия,Франция),
разработаны свои таблицы соответствия кириллицы и латинницы.

Волосы втают дыбом.
И это при том, что на 2 буквы - твердый знак и мягкий знак все уже давно махнули рукой,
либо полностью пропуская их, либо стыдливо заменяя апострофом или кавычкой.

Вышеприведенные стандарты для наглядности сведем в таблицу

Неактивен

 

#2 20-05-2005 17:10:24

pepelsbey
живёте
Откуда: Москва—Питер
Зарегистрирован: 20-04-2005
Сообщений: 70
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Да, я тоже занимался этим вопросом довольно подробно когда делал хак для TXP для транслит-урлов.
За основу я взял какой-то ГОСТ начала 90-х и немного еще модифицировал для соответствия современным традициям транслитерации.

Так что я уверен, что мы вполне можем разработать свой стандарт (соединив всё самое лучшее из мирового опыта), пока официальные инстанции не уделяют этому должного внимания.

Кстати, не стоит забывать про ограничения, накладываемые адресной строкой браузера:
для транслитерации у нас остаются только латинские буквы, дефис и подчёркивание... и никаких магкостей-твёрдостей и виде кавычек-апострофов.

Неактивен

 

#3 22-05-2005 16:44:56

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

pepelsbey написал:

Да, я тоже занимался этим вопросом....
За основу я взял какой-то ГОСТ начала 90-х и немного еще модифицировал для соответствия современным традициям транслитерации.

Я сравнивал.
За основу был взят указанный выше ГОСТ 16876-71. И изменено написание для буквы 'Щ'.

pepelsbey написал:

Кстати, не стоит забывать про ограничения, накладываемые адресной строкой браузера:
для транслитерации у нас остаются только латинские буквы, дефис и подчёркивание... и никаких магкостей-твёрдостей и виде кавычек-апострофов.

От этого никуда не денешься. Про твердые-мягкие знаки придется просто забыть. А что делать?
у французов сложнее ситуация с кавычками и апострофами.
Величавые имена, например, Д'Артаньян, в урлах трансформируются в вульгарных Дартаньянов :-)

Продолжу тему.
Следущая фраза у меня уже была написана.
"Наблюдая эту чехарду кодировок, появляется большой соблазн создать свою и посчитать ее очередным стандартом."
Я сделал паузу, чтобы промочить горло :-), и уважаемый Пепелсбей своим сообщениеи,

pepelsbey написал:

Так что я уверен, что мы вполне можем разработать свой стандарт (соединив всё самое лучшее из мирового опыта), пока официальные инстанции не уделяют этому должного внимания.

показал, что этот соблазн как инфекция, кружит в воздухе, грозя перерасти в эпидемию.

Приходит понимание, что надо, как барону Мюнхаузену, брать себя в руки, крепко напрячься, и, преодолев эту трясину соблазнов,
выбираться из этого хаоса, прибиваясь к какому-то берегу.

То есть, остановиться на каком-то одном, уже имеющим распространение, стандарте.
Выбирать, в общем-то, есть из чего.

Осталось только выработать критерии, на основании которых осуществить выбор.
1. Распространенность в Российском интернете.
    К сожалению - данных об этом нет.
2. Распространенность в мировом интернете.
    Блуждая в Сети наткнулся, что наибольшее распространение в мировом интернете получил BGN. К сожалению - ссылки
    под руками не осталось, но подумав, приходишь к выводу, что это вполне логично. Благодаря средствам массовой
    информации, которые любят муссировать географические названия, связанные с катаклизмами в нашей стране, благодаря
    туристическим и историческим справочникам.
    Возьмем этот стандарт на заметку.
3. Стандарт, который вряд ли изменится в ближайшие годы.
    ГОСТ может поменяться. Стандарт СЭВ не поменяется, так как организация, его разрабатывавшая, уже вряд ли возродится.
    С этой точки зрения я бы положился на западные стандарты, хотя, если сравнить транслит МВД с другими кодировками -
    замечаешь, что она почти полностью идентична все тому же стандарту BGN.
    МВД по неведомым причинам только добавило доп. варианты в написании буквы 'Ё' и (о, боже!) буквы 'И'.
    Хм.. присмотримся к BGN попристальнее.
4. Современные тенденции в русском интернете.
    Все мы не любим рекламу. Но работает, работает она. И благодаря миллионам, которые потратила компания Яндекс
    на рекламу своего бренда, прочно внедряется, что буква 'Я' пишется ( и должна писаться ) в транслите на латинницу как
    сочетание 'YA'.
    Проверим - оказалось, что компания Яндекс подстраховалась. Домен jandex.ru тоже принадлежит им,
    а вот, например, Ядро.ру (yadro.ru) даже и не стали тратить 20$ на альтернативный домен, видимо, утвердившись в мысли,
    что иная трактовка, кроме как Я=YA невозможна.
    В нашей таблице это написание используется в МВД, BGN и BSI.
5. Наименьшие отличия между таблицами.
    Логичным представляется рассмотреть группу таблиц, которые имеют наименьшие отличия, тем самым увеличивая степень
    соответствия нескольким стандартам.
    Глядя на таблицы видим, что минимальные отличия у двух групп.
    первая группа - 2 стандарта:
    российские-советские ГОСТ 16876-71 и СЭВ 1362-78 отличаются одной буквой 'Й'
    вторая группа - 3 стандарта:
    МВД -- BGN ( в таблице МВД присутствуют доп. варианты написания 2х букв ) и
    BGN -- BSI ( отличие в написании буквы 'Й' + в таблице BGN есть доп. написания букв 'Е' и 'Ё').
6. Отсутствие неоднозначностей.
    Желательно иметь однозначное написание для в стандарте для каждой из букв.
    У нас не будет возможностей анализировать в начале слова стоит та или иная буква или перед шипящей или после и т.п.
    С этой точки зрения МВД и BGN проигрывают остальным таблицам.

Проставим "баллы" каждой кодировке по вышеуказанным критериям ( 0 - не соответсвует, 1 - соответствует )
и занесем в таблицу.
    гост    сэв    мвд    LC    BGN    BSI
1.    0    0    0    0    0    0
2.    0    0    0    0    1    0
3.    0    1    1    1    1    1
4.    0    0    1    0    1    1
5.    1    1    1    0    1    1
6.    1    1    0    1    0    1
-------------------------------------------------------------
и:    2    3    3    2    4    4

По результатам - вперед выходят BGN и BSI.
Выбор между этими таблицами заключается в том, какая замена буквы 'Й' больше греет сердце - Y (в BGN) или 'I' (в BSI).
В случае выбора BGN определение однозначного написания букв 'Е' и 'Ё', думаю - особых проблем не составит.

Неактивен

 

#4 23-05-2005 14:18:58

pepelsbey
живёте
Откуда: Москва—Питер
Зарегистрирован: 20-04-2005
Сообщений: 70
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Evgeny, вам, как обладателю наиболее полной информации про различные стандарты транслитерации, предлагаю перевести эту фразу на "нечеловеческий язык" и на основе неё уже и сравнивать, что проще понять.

"съешь еще этих мягких франзуских булок да выпей чаю"

Как я понял, среди фаворитов BGN и BSI только у последнего претендента есть вариации транслитерации (звучит-то как) в зависимости от положения букв. И это большое преимущество.

Evgeny написал:

У нас не будет возможностей анализировать в начале слова стоит та или иная буква или перед шипящей или после и т.п.

Почему у нас не будет такой возможности? Мне кажется, что не стоит упускать такую удачную возможность сделать читабельность урлов несколько выше.

И вообще, стоит определиться в каком виде будет существовать этот "модуль" транслитерации урлов.
Либо в виде хака, либо в виде плагина.

Отредактированно pepelsbey (23-05-2005 14:23:54)

Неактивен

 

#5 23-05-2005 17:04:26

Nicck
ферт
Откуда: Ижевск
Зарегистрирован: 11-05-2005
Сообщений: 536
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

pepelsbey написал:


"съешь еще этих мягких франзуских булок да выпей чаю"

Либо в виде хака, либо в виде плагина.

…да выпей же чаю…

Я отстал от жизни и txp уже позволяет плагинам перегружать какие-то свои функции?

Неактивен

 

#6 23-05-2005 18:08:40

pepelsbey
живёте
Откуда: Москва—Питер
Зарегистрирован: 20-04-2005
Сообщений: 70
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Конечно же, куда же без буквы Ж smile

А я вообще слишком подробно в это не влезал... так что предположение насчёт плагина было только предположением.

Неактивен

 

#7 24-05-2005 11:12:19

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

к сожалению - только в виде хака :-(
поэтому все неоднозначности надо приводить к однозначности.

"съешь еще этих мягких франзуских булок да выпей же чаю"

Замечательный пример :-))

С учетом того, что в хаке мы можем сделать только однозначный транслит,
у каждого есть возможность открыть таблицы транслитов,
и потестировать самые заковыристые речевые обороты..

Неактивен

 

#8 24-05-2005 14:26:49

pepelsbey
живёте
Откуда: Москва—Питер
Зарегистрирован: 20-04-2005
Сообщений: 70
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

в хаке мы можем сделать только однозначный транслит

это почему? разве мы не можем сначала пройтись заменой сочетаний букв на латиницу, а потом заменить оставшиеся буковки?

Неактивен

 

#9 24-05-2005 18:29:14

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

pepelsbey
да. это возможно.
изначально я ориентировался на хак, сделанный тобой.
ты абсолютно прав. хак можно и усложнить.

Неактивен

 

#10 06-06-2005 13:23:07

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

В русской сборке Textpattern в качестве таблицы транслита используется BSI (где-то встретилось у американцев ее же название - ISA).
Если кто-то желает делать самостоятельно хак, описанный в п.2 русификации,
но используя таблицу BSI-ISA, данные для хака лежат в UTF-8 здесь.

Неактивен

 

#11 24-07-2005 22:39:02

amix
аз
Зарегистрирован: 24-07-2005
Сообщений: 1

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Большое спасибо Евгению за проделанную работу.

Мне кажется, было бы неплохо все-таки выработать еще один стандарт. Понятно, что плодить "стандарты" - гиблое дело, но очевидно и дикое несовершенство всех имеющихся. А надо-то обеспечить всего одну фичу: обратимость.

У меня нет готового решения, но было бы нечеловечески замечательно таковое выработать. Может быть, даже создать какую-то общерунетовскую группу для этой цели. Это непросто, однако с распространением ЧПУ в современных CMS и wiki необходимость уже назрела.

Неактивен

 

#12 27-07-2005 15:15:09

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

amix написал:

Мне кажется, было бы неплохо все-таки выработать еще один стандарт....А надо-то обеспечить всего одну фичу: обратимость....Может быть, даже создать какую-то общерунетовскую группу для этой цели.

Стандартизация усилиями отдельной группы вряд ли даст какой-то заметный эффект. Пусть даже эту группу поддержит кто-либо из Рунетовских монстров (Рамблер, Яндекс или Мэйл.ру) по отдельности, да даже и все вместе взятые.

Мы, "живя" в Интернете, забываем, что есть еше и Реал, который намного больше и мощнее Интернета.

А в Реале вопросы транслитерации могут интересовать чиновников, связанных с зарубежьем (именно там и нужна однозначность и обратимость). И попытки отдельных ведомств сделать свой стандарт были, пусть даже и свой, внутренний, но были.
Да им это надо. Многие из них и Интернета в глаза не видели. Но если прижмет, то они напишут еще один, свой стандарт. О существовании "рунетовской" группы они и не узнают.

И еще одна сфера, которой нужна транслитерация - это мобильная связь. СМС-ки то ведь приходится конвертировать. Не все мобилы поддерживают кириллицу, не все операторы (например, если абонент находится  за рубежом) и т.п. Точно не знаю, но предполагаю, что у каждой компании есть так же свой внутренний стандарт транслита. А таких компании - 3 крупных и десятки мелких.

Если объединятся все заинтересованные стороны, т.е. чиновники, телефонные компании и интернетчики, и примут единые правила транслита, тогда это может дать эффект. Через несколько лет у всех в сознании будет ОДНОЗНАЧНЫЙ и ОБРАТИМЫЙ вариант транслитерации.

Вот только надо ли кому это настолько, чтобы был резон такого объединения?
Я со своей колоколенки таких резонов не вижу.

При этом не надо забывать, что американцы вряд ли будут подстраиваться под наши локальные (с их точки зрения) стандарты. То есть, даже при наличии единого Российского стандарта, все равно, ОДНОЗНАЧНОСТИ не будет.

Возникает резонный вопрос. Может тогда нам подстроиться под их стандарты?
Может, фиг с ней, с обратимостью?

Неактивен

 

#13 27-07-2005 18:47:02

Nicck
ферт
Откуда: Ижевск
Зарегистрирован: 11-05-2005
Сообщений: 536
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Нам на самом деле не стандарт нужен, нам внятные урлы нужны. Я так думаю. Потому меня устроит любой вариант.

Неактивен

 

#14 28-07-2005 15:21:04

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Nicck написал:

Нам на самом деле не стандарт нужен, нам внятные урлы нужны. ...
Потому меня устроит любой вариант.

Чтобы уж закончить эту тему, поясню - зачем мне нужна была вся эта суета.
Все верно, Nicck. Нужны были внятные УРЛы, хотя они, зачастую, и не сильно важны. В конце-концов, много сайтов используют параметры в УРЛах (с амперсандами и вопр.знаками) и при этом неплохо себя чувствуют.
Вопрос только возникает - внятные для кого(чего)?

Вся эта суета была нужна только по одной причине. Имея некоторый опыт работы с поисковыми машинами, знаю, что есть такие, которые учитывают присутствие искомого термина в составе УРЛа.
Вы скажете, что латинскими буквами русские не пишут поисковые запросы? Ошибаетесь. Пишут.
Второй момент. Многие географические названия и торговые марки однозначно транслируются из русского в латинницу.
Кроме этого - фамилии, технические термины, детали, приборы и т.п.
Да, при этом мы получаем на сайт некоторый поток нерусскоговорящих посетителей. Но некоторым сайтам и нерусскоговорящие посетители не помеха, а если уж помеха, то есть технические способы, чтобы избежать этого потока.
Хотя одних УРЛов будет маловато, чтобы поток превратился в потоп, не надо строить иллюзий.

Да, посетители только с поисковых машин не решат наших (скорее всего и  Ваших) коммерческих проблем (если мы такими целями  руководствуемся при создании сайта), но некоторый "приварок" трафика (если он будет) с поисковиков забесплатно никому, думаю, лишним не будет.

И вот из этих соображений и была затеяна изыскательская работа.
Для того, чтобы к этому вопросу больше не возвращаться, когда сайты на ТП заработают, и изменения УРЛов могут стать болезненными.

Не могу отрицать, что "внятность" с эстетической точки зрения тоже имеет значение, приятнее, когда УРЛ становится "читаемым",
но тут, скорее, дело привычки.

P.S. Что-то мы много говорим про транслит. Надо возвращаться к более важным вопросам :-))

Неактивен

 

#15 28-07-2005 18:08:37

Nicck
ферт
Откуда: Ижевск
Зарегистрирован: 11-05-2005
Сообщений: 536
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Evgeny написал:

Nicck написал:

Нам на самом деле не стандарт нужен, нам внятные урлы нужны.

Чтобы уж закончить эту тему, поясню - зачем мне нужна была вся эта суета.
Все верно, Nicck. Нужны были внятные УРЛы, хотя они, зачастую, и не сильно важны. В конце-концов, много сайтов используют параметры в УРЛах (с амперсандами и вопр.знаками) и при этом неплохо себя чувствуют.
Вопрос только возникает - внятные для кого(чего)?
...
Не могу отрицать, что "внятность" с эстетической точки зрения тоже имеет значение, приятнее, когда УРЛ становится "читаемым",
но тут, скорее, дело привычки.

Дело не столько в красивости сколько в удобности (ура, я перевёл слово юзабилиити! ;]). Вот например я пишу кому-то: читай hostname/articles/css/soskakivanie-divov-v-msie или например hostname/engine.php?artid=12632. По второму урлу не ясно куда я попаду, первый же говорит сам за себя. Это в первую очередь удобно, эти варианты отличаются удобством.

А вот эти отличаются красивостью: hostname/articles/5/css-hacks, hostname/articles/css-hacks.

Неактивен

 

#16 25-03-2008 15:53:29

langprofi
аз
Зарегистрирован: 25-03-2008
Сообщений: 1

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Отличная статья! Кстати, по теме транслитерации русского в соответствии с различными стандартами, есть сайт TRANSLIT.US Помимо своей собственной таблицы транслитерации ("Универсальная") ещё предоставлена транслитерация по стандарту ГОСТ 7.79 (система Б) и ISO 9. Причем возможен перевод в обоих направлениях. Довольно таки полезно.

Неактивен

 

#17 15-01-2009 01:13:26

the_ghost
ять
Откуда: Минск
Зарегистрирован: 01-05-2007
Сообщений: 1957
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Реинкарнируем тему smile
Достучался до авторов txp, предложил исправить таблицу транслитерации символов. Вот что получилось - http://forum.textpattern.com/viewtopic. … 61#p198061

Готов выслушать ваши замечания по таблице. Меня смущает только буква Ц и принцип написания больших букв. Раньше Щ превращалось в SHCH, теперь в Shch. Мне кажется так лучше.

Код:

А = "A"
Б = "B"
В = "V"
Г = "G"
Д = "D"
Е = "E"
Ё = "Yo"
Ж = "Zh"
З = "Z"
И = "I"
Й = "J"
К = "K"
Л = "L"
М = "M"
Н = "N"
О = "O"
П = "P"
Р = "R"
С = "S"
Т = "T"
У = "U"
Ф = "F"
Х = "H"
Ц = "Ts"
Ч = "Ch"
Ш = "Sh"
Щ = "Shch"
Ы = "Y"
Э = "E"
Ю = "Yu"
Я = "Ya"
а = "a"
б = "b"
в = "v"
г = "g"
д = "d"
е = "e"
ё = "yo"
ж = "zh"
з = "z"
и = "i"
й = "j"
к = "k"
л = "l"
м = "m"
н = "n"
о = "o"
п = "p"
р = "r"
с = "s"
т = "t"
у = "u"
ф = "f"
х = "h"
ц = "ts"
ч = "ch"
ш = "sh"
щ = "shch"
ы = "y"
э = "e"
ю = "yu"
я = "ya"
Ъ = ""
ъ = ""
Ь = ""
ь = ""

.      Создание шаблонов для Textpatern http://textpattern.ru/forum/viewtopic.php?id=1665 (<txp:make_template quality="best" />)
КОНСУЛЬТАЦИИ по Textpattern - ICQ#8458496, nemiga@gmail.com <txp:if_question><txp:pay /></txp:if_question>
       Список всех тегов - http://textbook.textpattern.net/wiki/in … _Reference

Неактивен

 

#18 15-01-2009 14:07:01

Calm
добро
Зарегистрирован: 03-01-2009
Сообщений: 41

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Да нормальлно про Ц.
Например ЦАПЛЯ - TSAPLYA. А вот TCALPYA так и хочется прочесть как ТКАПЛЯ

Щ я бы заменил на Sch. Щука - Schuka.

Неактивен

 

#19 15-01-2009 14:16:31

aclorange
иже
Зарегистрирован: 07-01-2009
Сообщений: 138

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Я бы использовал для Я Jа, а не Yа. Tsaplja, moja, tvoja. Я оно как-то помягче, а получается цаплыа, а хотелось бы цаплйа. Так же и с Ю. В тех же польском, чешском, словацком зыках я это ja. А это славянские языки, использующие латиницу.

Неактивен

 

#20 15-01-2009 16:57:57

Calm
добро
Зарегистрирован: 03-01-2009
Сообщений: 41

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

а хотелось бы цаплйа

А мне бы не хотелось sad

Неактивен

 

#21 15-01-2009 17:06:18

aclorange
иже
Зарегистрирован: 07-01-2009
Сообщений: 138

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Calm, а на уроках русского языка учили, что букве я соответствует звук йа.

Гласные буквы я, е, ё, ю, когда стоят:
а) в начале слова (например: Яша, юла);
б) после гласной (например: маяк);
в) после разделительного мягкого знака (например: деревья, вьюга) дают два звука.
http://festival.1september.ru/articles/102151/img1.gif

Неактивен

 

#22 15-01-2009 19:32:43

advan
ю
Откуда: Mk
Зарегистрирован: 05-11-2006
Сообщений: 835
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

the_ghost написал:

Меня смущает только буква Ц ...

А я обычно пишу английскую C. А букву Й как Y ... smile

the_ghost написал:

... и принцип написания больших букв. Раньше Щ превращалось в SHCH, теперь в Shch. Мне кажется так лучше.

Абсолютно согласен!


Знакомьтесь на здоровье - http://love.kachok.ru  /  Я в PHP ниПХПуя незнаю! :)

Неактивен

 

#23 15-01-2009 19:47:24

Evgeny
ять
Зарегистрирован: 15-03-2005
Сообщений: 1869

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Я свою точку зрения излагал выше: Лучше придерживаться хоть какого-то (даже и на совсем удачного) стандарта.
Мнение это не изменилось.
Исключение - если стандарт сильно устарел и начинает создавать серьезные проблемы.

Неактивен

 

#24 16-01-2009 00:10:31

sgm
добро
Зарегистрирован: 26-01-2007
Сообщений: 48

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Буква "j" для "й" - это остаток от немецкого стандарта транслитерации. Сейчас вроде больше ориентируются на американско-британский стандарт. При этом хотя "je, jo, ja, ju" и присутствуют как варианты передачи букв "е, ё, я, ю", но "ye/e, yo/io, ya/ia, yu/iu" вроде чаще употребляются для данных русских букв. На мой взгляд, в URL "ya, yu, ye, iy, y" (я, ю, е, ий, ы) читаются легче, а буквой "ё" можно пренебречь, наверное.

е - e, ye
ё - io, yo; (или передается как е - e, ye)
ж - zh
й - i, y, j
х - kh
ц - ts
ч - ch
ш - sh
щ - shch
ъ  - ' (или никак не передается)
ы - y
ь - ' (или никак не передается)
э - e
ю - iu, yu
я - ia, ya

Для сравнения, вот результаты с сайта http://translit.cc/ :

Мой текст: яблоко юный земля ёлочный жизнь марьяна юлия белинская
jabloko junyj zemlja jolochnyj zhizn' mar'jana julija belinskaja - Universal
yabloko yunyj zemlya yolochnyj zhizn' mar'yana yuliya belinskaya - GOST 7.79 B
âbloko ûnyj zemlâ ëločnyj žizn' mar'âna ûliâ belinskaâ - ISO 9

Ссылки по теме:
http://en.wikipedia.org/wiki/Romanization_of_Russian  - внутри и в конце много ссылок на разные источники и таблицы транслитерации в виде pdf
http://en.wikipedia.org/wiki/Informal_r … of_Russian
http://www.gsnti-norms.ru/norms/common/ … s/7_79.htm  -  это один из отечественных нормативных документов.

Неактивен

 

#25 16-01-2009 02:09:51

the_ghost
ять
Откуда: Минск
Зарегистрирован: 01-05-2007
Сообщений: 1957
Вебсайт

Re: Транслитерация. Кириллица и латинница. Изучение вопроса.

Больше всего нравится стандарт BGN/PCGN - http://en.wikipedia.org/wiki/BGN/PCGN_r … of_Russian
Кое-какие отличия между нем и вариантом из моего предложения по транлитерации:

Код:

х - kh (было h)
й - y (было j)
ё - yё (было yo)

C "и картким" я согласен, игрек (y) сойдет и достаточно узнаваем, может даже больше, чем "j". Но вот вариант с Ё я предлагаю оставить как yo, а не "уё", все-таки диактрический символ в урл не охота пускать. Поэтому оставить как "yo", а не "e"  - если пользователь хотел написать слово через ё, а не через е, значит ему важно произношение. Но это имхо...

И не совсем ясно - зачем писать "х" (ха) через "kh"? Разве написание через одиночное "h" оставляет какие-либо варианты для двойного толкования транслита?


.      Создание шаблонов для Textpatern http://textpattern.ru/forum/viewtopic.php?id=1665 (<txp:make_template quality="best" />)
КОНСУЛЬТАЦИИ по Textpattern - ICQ#8458496, nemiga@gmail.com <txp:if_question><txp:pay /></txp:if_question>
       Список всех тегов - http://textbook.textpattern.net/wiki/in … _Reference

Неактивен

 

Board footer

RSS   Rambler's Top100
Powered by PunBB
Textpattern.ru