Транслитерация

Представление букв русского алфавита буквами латинского с диакритиками и без

Транслитерация производится одним из трех методов. Два метода соответствуют требованиям ГОСТ 7.79-2000. Система А представляет собой т.н. строгую транслитерацию: одной букве русского алфавита соответствует один символ после транслитерации. Для того, чтобы добиться такого результата, часть символов получает знаки диакритики. Система Б использует исключительно символы из самого распространенного, базового набора – ASCII. «Платой» за это является необходимость использовать в ряде случаев несколько латинских букв для одной русской.

В то время как система А вполне однозначна, система Б дает некоторый простор для интерпретации. Например, по прочтении стандарта остается не совсем ясным, как следует обходиться с заглавными буквами, состоящими после транслитерации из нескольких символов. Данный конвертер действует по следующей схеме: МосЖилСтрой → MosZhilStroj; ЖСК → ZHSK.

Третья система транслитерации представляет собой несколько упрощенный вариант англо-американского стандарта BGN/PCGN. Этот стандарт с небольшими вариациями широко используется в англо-американском мире, в частности, в российских научных журналах, которые стремятся попасть в американские научные базы, чтобы воплотить в жизнь требования Указа Президента РФ № 599 от 7 мая 2012 года «О мерах по реализации государственной политики в области образования и науки». Упрощения при конверсии на данной странице касаются следующих моментов: буква Ёё передается как YO, yo (по стандарту: Ëë); буквы Ее и Ёё всегда передаются одинаковым образом, в то время как стандарт предусматривает два разных способа в зависимости от местоположения в слове и предшествующих букв. Есть также одно усложнение по сравнению со стандартом: буква Ээ передается сочетанием Eh, eh.

Схему замен можно вывести с помощью кнопки Демо. Предыдущее содержание обоих окон при этом будет стерто.

Режим Автобуфер позволяет конвертировать текст с минимумом действий пользователя. В этом режиме фрагмент, копируемый из буфера в окно исходного текста, заменяет целиком его предыдущее содержание и сразу же конвертируется. Для того, чтобы скопировать результат обратно в буфер, достаточно вызвать соответствующую команду, например: Ctrl+C. Маркировать ничего не нужно, в буфер будет скопировано все содержание нижнего окна. Какой из элементов страницы активирован, также не имеет значения.

Если Вы заметили ошибки в алгоритме транслитерации либо у Вас есть идеи или пожелания, буду рад Вашему сообщению по электронной почте.

 

Copyright А. Румянцев, 2018 MailBox