terça-feira, 2 de setembro de 2014

Transliterando escrita cirílica


Link curto pra esta postagem: fishuk.cc/translit

Última atualização: 1.º de maio de 2016


Nota (3/10/2021): Acabo de fazer leves mudanças na redação e no design desta postagem, mas não no conteúdo. Porém, dado que há alguns anos tenho me alertado por leituras e por indicações de conhecidos sobre a real diferença entre transliteração e transcrição, hoje acredito que meu texto seja essencialmente sobre o segundo conceito. O primeiro, que era originalmente minha intenção, liga-se na verdade às tabelas ISO apresentadas mais ao fim, pois tem a ver com o intercâmbio letra a letra, símbolo a símbolo. No caso de uma transcrição, essa equivalência não é inevitável, e trata-se antes de uma adaptação ao formato da língua de chegada, sem necessário decalque de informações gráficas ou fonológicas. Como meu trabalho visa antes à padronização visual, e não à didática linguística, acredito que ele continua tendo valorosa utilidade.

Há anos estudando o comunismo e lendo sobre línguas eslavas, enfrento o problema da transliteração do alfabeto cirílico em várias línguas pra caracteres latinos. Seria perfeito se todos soubessem ler esse alfabeto e os textos de especialistas ficassem uma salada de frutas gráfica, mas a uniformização e a necessidade do contato com leigos exigem adaptações que são, no melhor dos casos, paliativas.

Apesar das várias soluções que falantes do português já propuseram pro russo e pro ucraniano, jamais foi regulamentado um sistema que servisse pra transliterar os vários idiomas em qualquer ocasião. Em outras línguas ocidentais também não há consenso, e cada país que fala uma língua eslava costuma usar mais de um sistema, embora um ou outro seja considerado “oficial” na administração pública ou pra passaportes. Mas como na área de humanidades cada um usa a regra que mais lhe convém, decidi sistematizar minha própria solução, pra meu uso pessoal e também a quem mais se interessar.

Este sistema abrange cinco idiomas eslavos que usam o alfabeto cirílico: russo, ucraniano, búlgaro, belarusso e macedônio. Analisei o que mais tenho visto nas áreas de história e literatura, pesquisei sobre os idiomas que conhecia pouco e tentei aproveitar ao máximo os outros sistemas. Por vezes considerei peculiaridades de pronúncia e gramática, daí algumas dessemelhanças entre as línguas, como a transliteração da letra Щ, pronunciada como um “ch” suave em russo, “chtch” em ucraniano e “cht” em búlgaro. Não abordo idiomas não eslavos nem a língua sérvia, que compartilha uma romanização com o croata. O macedônio, muito influenciado pelo sérvio, tem um sistema parecido, usado por cientistas (ver seção sobre o ISO 9), mas como não foi oficializado, também criei o meu próprio.

Em história, mais do que em literatura, predominam sistemas baseados na língua inglesa, talvez por ser a língua de boa parte da melhor bibliografia sobre o Leste europeu. Eles foram, portanto, minha fonte central, sem que eu desconsiderasse usos brasileiros, franceses e dos próprios países eslavos. Busquei dispensar sinais diacríticos (acentos, cedilha) ou caracteres além do alfabeto padrão de 26 letras, por isso não é importante conhecer e marcar a sílaba tônica das palavras, como fazem alguns brasileiros. Pretendo apenas oferecer um sistema acessível a qualquer pessoa dispondo do material em cirílico, assim toco mais no aspecto gráfico do que na pronúncia ou gramática, as quais os interessados podem pesquisar por fora.

Começo apresentando os cinco alfabetos cirílicos, com maiúsculas, minúsculas e seus respectivos nomes. Não há sinais diacríticos, sendo parte inerente a algumas letras os sinais sobre elas. Os mais apressados podem pular pras tabelas de transliteração logo a seguir, de preferência lendo as indicações básicas mais abaixo, e dispensar as informações adicionais, destinadas ao aprofundamento. Ao final, falo sobre dois sistemas mais técnicos e atentos à equivalência letra a letra, que incluem consoantes acentuadas, e então apresento o alfabeto cursivo em cada língua.


Apresentando os alfabetos cirílicos

Russo

А а = aК к = kaХ х = kha
Б б = beЛ л = elЦ ц = tse
В в = veМ м = emЧ ч = che
Г г = geН н = enШ ш = sha
Д д = deО о = oЩ щ = scha
Е е = ieП п = peЪ ъ = tviordy znak
(ou “sinal duro”)
Ё ё = ioР р = erЫ ы = y
Ж ж = zheС с = esЬ ь = miagki znak
(ou “sinal brando”)
З з = zeТ т = teЭ э = e
И и = iУ у = uЮ ю = iu
Й й = i kratkoie
(ou “i breve")
Ф ф = efЯ я = ia


Ucraniano

А а = aІ і = iТ т = te
Б б = beЇ ї = iiУ у = u
В в = veЙ й = iotФ ф = ef
Г г = heК к = kaХ х = kha
Ґ ґ = geЛ л = elЦ ц = tse
Д д = deМ м = emЧ ч = che
Е е = eН н = enШ ш = sha
Є є = ieО о = oЩ щ = shcha
Ж ж = zheП п = peЬ ь = miaky znak
(ou “sinal brando”)
З з = zeР р = erЮ ю = iu
И и = yС с = esЯ я = ia

Há ainda o apóstrofo separador (’), que pode aparecer
entre uma consoante e um Є, Ї, Ю ou Я.


Búlgaro

А а = aК к = kaФ ф = fa
Б б = baЛ л = laХ х = kha
В в = vaМ м = maЦ ц = tsa
Г г = gaН н = naЧ ч = cha
Д д = daО о = oШ ш = sha
Е е = eП п = paЩ щ = shta
Ж ж = zhaР р = raЪ ъ = er goliam
(ou “er grande”)
З з = zaС с = saЬ ь = er malak
(ou “er pequeno”)
И и = iТ т = taЮ ю = iu
Й й = i kratko
(ou “i breve”)
У у = uЯ я = ia


Belarusso

А а = aК к = kaФ ф = ef
Б б = beЛ л = elХ х = kha
В в = veМ м = emЦ ц = tse
Г г = geН н = enЧ ч = che
Д д = deО о = oШ ш = sha
Е е = ieП п = peЫ ы = y
Ё ё = ioР р = erЬ ь = miakki znak
(ou “sinal brando”)
Ж ж = zheС с = esЭ э = e
З з = zeТ т = teЮ ю = iu
І і = iУ у = uЯ я = ia
Й й = i neskladovaie
(ou “i breve”)
Ў ў = u neskladovaie
(ou “u breve”)

Há ainda o apóstrofo separador (’), que pode aparecer
entre uma consoante e um Е, Ё, І, Ю ou Я.


Macedônio

А а = aИ и = iС с = sa
Б б = baЈ ј = iaТ т = ta
В в = vaК к = kaЌ ќ = tia
Г г = gaЛ л = laУ у = u
Д д = daЉ љ = liaФ ф = fa
Ѓ ѓ = diaМ м = maХ х = kha
Е е = eН н = naЦ ц = tsa
Ж ж = zhaЊ њ = niaЧ ч = cha
З з = zaО о = oЏ џ = dzha
Ѕ ѕ = dzaП п = paШ ш = sha
Р р = ra


Tabelas de transliteração e outras instruções

Importará lembrar que são vogais: em russo, as letras А, Е, Ё, И, О, У, Ы, Э, Ю e Я; em ucraniano, as letras А, Е, Є, И, І, Ї, О, У, Ю e Я; em búlgaro, as letras А, Е, И, О, У, Ъ, Ю e Я; em belarusso, as letras А, Е, Ё, І, О, У, Ы, Э, Ю e Я; e em macedônio, as letras А, Е, И, О e У.


Russo

А = AК = KХ = KH
Б = BЛ = LЦ e ТС = TS
В = VМ = MЧ = CH
Г = GН = NШ = SH
Д = DО = OЩ = SCH
Е = E (inclusive após Й)
- IE em início de palavra,
após vogal (exceto И ou
Ы) e após Ъ e Ь
П = PЪ = nulo; mas influencia
a transliteração das
vogais Е, Ё, Ю e Я
Ё = IO
- O após Ж, И, Ч, Ш e Щ
(mas IO se seguidas de Ъ
ou Ь)
Р = RЫ = Y
- Opcional, ЫЙ no final
de nomes próprios ou
adjetivos: Y
Ж = ZHС = SЬ = nulo; mas influencia
a transliteração das
vogais Е, Ё, Ю e Я
- Antes de А, О, У =
I (raro)
З = ZТ = TЭ = E
И = I
- Opcional, ИЙ no final
de nomes próprios ou
adjetivos: I
У = UЮ = IU
- U após Ж, И, Ч, Ш e Щ
(mas IU se seguidas de
Ъ ou Ь)
Й = IФ = FЯ = IA
- A após Ж, И, Ч, Ш e Щ
(mas IA se seguidas de
Ъ ou Ь)


Ucraniano

А = AІ = I
- Opcional, ІЙ no final
de nomes próprios ou
adjetivos: I
Т = T
Б = BЇ = II
- I após vogais
У = U
В = VЙ = I
- ІЙО = IO
Ф = F
Г = H
- ЗГ, КГ, ЛГ, НГ, СГ e
ЦГ = Z’H, K’H, L’H,
N’H, S’H e TS’H
К = KХ = KH
Ґ = GЛ = LЦ e ТС = TS
Д = DМ = MЧ = CH
Е = EН = NШ = SH
Є = IE
- Após I e И = E
О = OЩ = SHCH
Ж = ZHП = PЬ = nulo
- Antes de А, Е,
О e У = I
З = ZР = RЮ = IU
- Após І e И = U
И = Y
- Opcional, ИЙ no final
de nomes próprios ou
adjetivos: Y
С = SЯ = IA
- Após I e И = A

Apóstrofo separador (’): nulo.


Búlgaro

А = AК = KФ = F
Б = BЛ = LХ = KH
В = VМ = MЦ e ТС = TS
Г = GН = NЧ = CH
Д = DО = OШ= SH
Е = EП = PЩ = SHT
Ж = ZHР = RЪ = A
З = ZС = SЬ = I
И = IТ = TЮ = IU
- Após И = U
Й = I
- ИЙО = IO
У = UЯ = IA
- Após И = A


Belarusso

А = AК = KФ = F
Б = BЛ = LХ = KH
В = VМ = MЦ e ТС = TS
Г г = GН = NЧ = CH
Д д = DО = OШ = SH
Е = E (inclusive após Й)
- IE em início de palavra,
após vogal (exceto І ou
Ы) e após Ь ou apóstrofo
П = PЫ = Y
Ё = IO
- O após І e Ы
Р = RЬ = nulo
- Antes de
А, О e У = I
Ж = ZHС = SЭ = E
З = ZТ = TЮ = IU
- U após І e Ы
І = IУ = UЯ = IA
- A após І e Ы
Й = IЎ = U

Apóstrofo separador (’): nulo.


Macedônio

А = AИ = IС = S
Б = BЈ = I
- No encontro ИЈ
antes de vogal,
não se translitera
Т = T
В = VК = KЌ = TI
- Antes de ИЈ = T
Г = GЛ = LУ = U
Д = DЉ = LI
- Antes de ИЈ = L
Ф = F
Ѓ = DI
- Antes de ИЈ = D
М = MХ = KH
Е = EН = NЦ = TS
Ж = ZHЊ = NI
- Antes de ИЈ = N
Ч = CH
З = ZО = OЏ = DZH
Ѕ = DZП = PШ = SH
Р = R

Não confunda o И ucraniano com o И de outras línguas eslavas que usam o cirílico, como o russo, onde a letra, via de regra, soa como nosso I em “vida” e é, portanto, transliterada como I.

Se o contexto não esclarecer os casos de ambiguidade em certas palavras com e sem Ь, ele pode ser transliterado com um apóstrofo (’). Ver russo угол = ugol, уголь = ugol’; ucraniano мід = mid, мідь = mid’; лют = liut, лють = liut’; belarusso вугал = vugal, вугаль = vugal’. No ucraniano e no belarusso, o apóstrofo separador (’) não é transliterado, mas pode sê-lo por dois apóstrofos (’’) se necessário.

Consoantes permanecem dobradas quando cada uma é transliterada com apenas uma letra no alfabeto latino. Mas se a consoante se torna duas letras no alfabeto latino, pode-se escrever como se fosse apenas uma em cirílico, sem dano à compreensão. Alguns exemplos: оттепель (ottepel; “degelo” em russo), волосся (volossia; “cabelo” em ucraniano), именно (imenno; “exatamente” em búlgaro), ззяць (zziats; “brilhar”, “irradiar” em belarusso). Mas: пицца (pitsa; “pizza” em russo), ніччю (nichiu; “à noite” em ucraniano), падарожжа (padarozha; “viagem”, “jornada” em belarusso).

Siglas ou abreviaturas que envolvam letras transliteradas com mais de uma levam todas as letras latinas, e só a primeira em maiúscula. Alguns exemplos: ЦК (центральный комитет) = TsK (“comitê central” em russo), Ю. (Юлія) Тимошенко = Iu. (Iulia) Tymoshenko, САЩ (Съединени американски щати) = SASht (“Estados Unidos da América” em búlgaro), БХД (Беларуская хрысціянская дэмакратыя) = BKhD (Democracia Cristã Belarussa), Ё. (Ёўга) Казлова = Іо. (Iouga) Kazlova (antigo nome belarusso).

Com a letra ucraniana Г transliterada H, algumas combinações dela com outra consoante podem causar confusão, como КГ, que seria KH, combinação já usada, porém, pra letra Х. Para evitar, por exemplo, a pronúncia das combinações NH e LH como em português, quando na verdade são dois sons distintos, alguns sistemas sugerem separar as letras com um ponto (∙). Mas pra me ater ao teclado comum prefiro o apóstrofo, embora sem caráter obrigatório: ЗГ, КГ, ЛГ, НГ, СГ e ЦГ seriam respectivamente Z’H, K’H, L’H, N’H, S’H e TS’H. Exemplos: згаяти (z’haiaty; “desperdiçar”), альгебра (al’hebra; “álgebra”), Болгарія (Bol’haria; “Bulgária”), ангел (an’hel; “anjo”).

Em textos impressos ou na mídia russa, geralmente a letra Ё (io) é escrita sem os dois pontos, ou seja, idêntica à letra E (ie), o que pode causar confusão ao se transliterar. Para saber quando uma palavra russa possui a letra Ё ao invés de E, especialmente em nomes próprios, é interessante consultar a Wikipédia em russo ou em inglês, ou um dicionário como o do site Gramota.ru.


Informações adicionais

Não existem exceções às regras expostas acima, aplicáveis em qualquer ocasião. Porém, por razões de clareza, achei melhor mostrar casos um pouco mais complexos ou exemplos de situações que podem gerar estranheza ao leitor desacostumado às línguas eslavas, mas mesmo assim não justificam qualquer desvio das regras.

É comum o acúmulo de consoantes idênticas ou cujos pontos de articulação são semelhantes. Exemplos: russo отцу (ottsu; “ao pai”), лучше (luchshe; “melhor”); ucraniano багатшати (bahatshaty; “enriquecer-se”), розширити (rozshyryty; “alargar”, “aumentar”); búlgaro площта (ploshtta; “a área”, “a região” em búlgaro).

Por vezes a letra Й (I semivocálico) aparece junto de vogais “iotadas” (IA, IO, IU etc.) ou do equivalente ao I ou Y em cada língua. Exemplos: russo йеменец (iemenets; “iemenita”), выйти (vyiti; “sair”, “partir”); ucraniano зйомка (ziomka; “retirada”, “filmagem”), двійка (dviika; “par”, “dois”); búlgaro йогурт (iogurt; “iogurte”), Българийо (Balgario; “Bulgária!”, “Oh, Bulgária”, forma vocativa rara).

Em russo as letras Ъ e Ь em geral não são transliteradas, mas podem modificar a transliteração de outras. Exemplos: тень (ten; “sombra”), mas отъезд (otiezd; “partida”), пьеса (piesa; “peça de teatro”). Após “chiantes”: жюри (zhuri; “júri”), брошюра (brochura; “brochura”), mas ложью (lozhiu; “mentira” no caso instrumental), я шью (ia shiu; “eu costuro”). Em ucraniano e em búlgaro é comum ocorrer também o encontro ЬО, no qual a letra Ь é então transliterada I. Exemplos: ucraniano сьогодні (siohodni; “hoje”), льон (lion; “linho”, “tecido de linho”); búlgaro миньор (minior; “mineiro”, “operário de mina”), Петьо (Petio; nome próprio). No russo essa combinação só costuma aparecer na transcrição de palavras estrangeiras: Гран-Гиньоль (Gran-Giniol; “Grand-Guingol”, antiga casa francesa de teatro macabro).

Nas línguas em que pode haver vogais “iotadas” após a letra equivalente a Y, elas são sempre transliteradas sem o I, assim como após a equivalente a I. Exemplos: russo белые (belye; “brancos/as”); ucraniano чиє (chye; “cujo”, gênero neutro), Київ (Kyiv; “Kiev” ou “Kyiv”); belarusso партыя (partya; “partido”).

A letra ucraniana Ї é transliterada II em começo de palavra ou após o apóstrofo separador, mas é transliterada I após vogais: їхати (iikhaty; “ir ou vir de veículo”), з’їзд (ziizd; “congresso”). Mas: Україна (Ukraina; “Ucrânia”) атеїзм (ateizm; “ateísmo”), Іспанії (Ispanii; “da/pra/na Espanha”), кроїти (kroity; “cortar”).

Em belarusso, a letra Г pode indicar o próprio som do G duro em “gato”, o que acontece apenas em algumas palavras de origem estrangeira, ou um som fricativo semelhante a um H pronunciado com vibração das cordas vocais (o G da palavra espanhola amigo). Boa parte dos sistemas translitera por H, mas prefiro a solução de outros, que é usar sempre G, qualquer que seja a pronúncia.

Dica pra escritores e acadêmicos: em referências bibliográficas, não importa a língua do material citado, não corrijo a transliteração usada pra palavras eslavas, mesmo que divirja do meu sistema, o qual, porém, posso usar no corpo do texto. Por exemplo: um livro sobre Khruschov continua citado com as possíveis grafias “Kruschiov”, “Khrushchev” etc., assim como Lenin se mantém “Lênin” ou “Lenine”, Stalin se mantém “Stálin” ou “Estaline” e Gorbachov continua “Gorbatchev”. Um hipotético livro sobre cultura ucraniana mantém as pessankê ou pêssankas no título, embora eu discorra sobre pysanky, ovinhos pintados à mão em várias cores e desenhos. Ou cito uma obra que anuncia receitas de chkembe tchorba, mas falo no texto sobre a shkembe chorba, sopa famosa na Bulgária e países próximos.

Esse sistema de caráter técnico é mais próximo da ortografia das línguas eslavas que usam alfabeto latino e se usa, por exemplo, em periódicos científicos internacionais (transcrição de títulos de revistas e nomes de autores em línguas eslavas ou palavras eslavas em textos ocidentais), sendo mais fiel à equivalência gráfica do que à pronúncia. Seguem abaixo as versões pras cinco línguas aqui tratadas, e neste artigo da Wikipédia em inglês em outras línguas ainda:


Russo

А а = A aК к = K kХ х = H h
Б б = B bЛ л = L lЦ ц = C c
В в = V vМ м = M mЧ ч = Č č
Г г = G gН н = N nШ ш = Š š
Д д = D dО о = O oЩ щ = Ŝ ŝ
Е е = E eП п = P pЪ ъ = ´´ (2 agudos)
Ё ё = Ë ëР р = R rЫ ы = Y y
Ж ж = Ž žС с = S sЬ ь = ´ (1 agudo)
З з = Z zТ т = T tЭ э = È è
И и = I iУ у = U uЮ ю = Û û
Й й = J jФ ф = F fЯ я = Â â


Ucraniano

А а = A aІ і = Ì ìТ т = T t
Б б = B bЇ ї = Ï ïУ у = U u
В в = V vЙ й = J jФ ф = F f
Г г = G gК к = K kХ х = H h
Ґ ґ = G̀ g̀Л л = L lЦ ц = C c
Д д = D dМ м = M mЧ ч = Č č
Е е = E eН н = N nШ ш = Š š
Є є = Ê êО о = O oЩ щ = Ŝ ŝ
Ж ж = Ž žП п = P pЬ ь = ´ (1 agudo)
З з = Z zР р = R rЮ ю = Û û
И и = I iС с = S sЯ я = Â â

Sinal separador = ’ (apóstrofo)


Búlgaro

А а = A aК к = K kФ ф = F f
Б б = B bЛ л = L lХ х = H h
В в = V vМ м = M mЦ ц = C c
Г г = G gН н = N nЧ ч = Č č
Д д = D dО о = O oШ ш = Š š
Е е = E eП п = P pЩ щ = Ŝ ŝ
Ж ж = Ž žР р = R rЪ ъ = A`
(A seguido de grave)
З з = Z zС с = S sЬ ь = ´ (1 agudo)
И и = I iТ т = T tЮ ю = Û û
Й й = J jУ у = U uЯ я = Â â


Belarusso

А а = A aК к = K kФ ф = F f
Б б = B bЛ л = L lХ х = H h
В в = V vМ м = M mЦ ц = C c
Г г = G gН н = N nЧ ч = Č č
Д д = D dО о = O oШ ш = Š š
Е е = E eП п = P pЫ ы = Y y
Ё ё = Ë ëР р = R rЬ ь = ´ (1 agudo)
Ж ж = Ž žС с = S sЭ э = È è
З з = Z zТ т = T tЮ ю = Û û
І і = Ì ìУ у = U uЯ я = Â â
Й й = J jЎ ў = Ŭ ŭ

Sinal separador = ’ (apóstrofo)


Macedônio

А а = A aИ и = I iС с = S s
Б б = B bЈ ј = J̌ ǰТ т = T t
В в = V vК к = K kЌ ќ = Ḱ ḱ
Г г = G gЛ л = L lУ у = U u
Д д = D dЉ љ = L̂ l̂Ф ф = F f
Ѓ ѓ = Ǵ ǵМ м = M mХ х = H h
Е е = E eН н = N nЦ ц = C c
Ж ж = Ž žЊ њ = N̂ n̂Ч ч = Č č
З з = Z zО о = O oЏ џ = D̂ d̂
Ѕ ѕ = Ẑ ẑП п = P pШ ш = Š š
Р р = R r

Devido à estranheza gráfica e à dificuldade em digitar certos caracteres, há publicações científicas, especialmente de humanas, que fazem algumas adaptações, as quais também listo abaixo (leia em inglês sobre a transliteração científica do cirílico):
  • Russo: CH ou X ao invés de H, ŠČ ao invés de Ŝ, JU ao invés de Û e JA ao invés de Â.
  • Ucraniano: H ao invés de G, G ao invés de G̀, JE ao invés de Ê, Y ao invés de I, I ao invés de Ì, JI ao invés de Ï, X ao invés de H, ŠČ ao invés de Ŝ, JU ao invés de Û, JA ao invés de  e nulo pro apóstrofo separador.
  • Búlgaro: X ao invés de H, ŠT ao invés de Ŝ, Ă ao invés de A`, J ao invés do acento agudo, JU ao invés de Û e JA ao invés de Â.
  • Belarusso: H ao invés de G, I ao invés de Ì, W ao invés de Ŭ (opcional), X ao invés de H, JU ao invés de Û, JA ao invés de  e nulo pro apóstrofo separador.
  • Macedônio: DZ ao invés de Ẑ, J ao invés de J̌, LJ ao invés de L̂, NJ ao invés de N̂ e DŽ ao invés de D̂. O sistema ISO 9 com essas adaptações é a transliteração do macedônio mais usada no ensino e na linguística.

Os alfabetos cirílicos em letra cursiva


Russo


Ucraniano


Búlgaro


Belarusso


Macedônio