A Grande Mudança Vocálica, ou por que a ortografia dos vogais em inglês é tão confoosa

Por que a discrepância entra a ortografia das vogais em inglês é tão grande em relação a quase todas as outras línguas que usam o alfabeto latino? Por exemplo, a escritura <oo> representa o som /u:/ que deveria ser a da letra U. <ee> e <ea> soam como /i:/ que geralmente é função da letra I, e <a> é ora /ɑ/, o que não há nada de estranho, ora o bem inesperado /eɪ/.

Podemos fazer um contraste com o espanhol, em que os grafemas A E I O U representam os sons /a/ /e/ /i/ /o/ /u/, preservando os valores originais do latim. Outros idiomas europeus, que têm sistemas vocálicos mais complexos, inclusive o português, geralmente têm ortografias claramente fundamentas nas valores “continentais” das letras.

Por que não se escreve “eye” ai, “food” fuud, ou “treaty” triti? A explicação depende de um fenômeno chamado a Grande Mudança Vocálica.

Introduzido pelo linguista dinamarquês Otto Jespersen no começo do século 20, o GMV se refere à reorganização profunda do conjunto de vogais longos que ocorreu aproximadamente entre 1300 e 1700, entre as épocas do Chaucer e do Shakespeare. Essa transformação às vezes até se considera a fronteira que marca o fim do inglês médio e o início do inglês moderno.

Jespersen notou que as vogais longas do inglês médio sofreram uma série de mudanças que parecem formar um conjunto coerente. Descreveu o padrão no seguinte gráfico:

Gráfico de Jespersen (1909)

A parte de esquerda do gráfico representa as transformações das vogais longas anteriores. O movimento para cima indica que cada uma das vogais ficou um nível mais fechada, tomando o lugar da próxima. A vogal mais fechada /i:/ não teve mais aonde ir (se fechar-se mais ainda, a língua ia tocar no palato e assim fazer uma consoante) e foi forçada a sofrer uma outra mudança, formando o ditongo /ei/, o que depois virou /ai/, o chamado “I longo.” Este mecanismo hipotético e chamado chain shift (deslocamento em cadeia): uma mudança de som desencadeia uma reorganização do sistema inteiro porque os falantes tendem a ajustar a sua pronuncia para evitar a fusão de dois fonemas cuja distinção é importante para a inteligibilidade.

As vogais longas posteriores sofreram mudanças parecidas: cada uma ficou um nível mais fechada, e a mais fechada /u:/ foi forçada para fora e virou o ditongo /ou/.

Embora os sons tenham mudado, a ortografia ainda se baseia na fonologia antes da Grande Mudança. Para ter uma idéia concreta de como isso funcionava, basta ver este vídeo dos Contos de Cantuária enunciados no inglês médio, aproximando a pronúncia que teria usado o Chaucer no século 14.

Também podemos fazer um resumo das mudanças na forma de uma tabela das vogais longos do inglês médio e os seus equivalentes no inglês moderno (adaptado da Wikipédia):

PalavraPronúncia original aproximadaVogal no inglês médioVogal no inglês moderno
bite“beet”/iː//aɪ/
meet“mate”/eɪ//iː/
meat“met”/ɛ://iː/
mate“maht”/ɑː//eɪ/
out“oot”/uː//aʊ/
boot“bote”/oʊ//uː/
boat“bot”/ɔː//oʊ/

(é interessante notar aqui que o som /a/ da palavra father é uma inovação posterior à Grande Mudança que encheu o vácuo deixado pela falta de vogal aberta.)

Uma das coisas mais interessantes na linguística é como padrões abstratos emergem de processos tácitos, privados de intencionalidade, inseridos num contexto corporal e social e distribuídos no tempo e no espaço. O gráfico do Jespersen apresenta um esquema simples que explica as mudanças que ocorreram entre o “inglês médio” e o “inglês moderno.” Mas de fato nunca houve um só “inglês médio.” Melhor dizer que existiram vários dialetos que costumamos interpretar como fazendo parte de um fenômeno maior chamado “inglês médio.” E no inglês moderno as realizações dos vogais não são nem de longe as mesmas entre todas as variedades do idioma. Através de análises de textos escritos na época sobre a pronúncia e de comparações entre as variedades sobreviventes e históricas do inglês, sabemos que as mudanças compreendidas dentro da Grande Mudança Vocálica de fato ocorreram gradualmente, num período de vários séculos.

Nos anos 1980, os linguistas Stockwell e Minkova introduziram uma análise que desconstruiu o conceito da Grande Mudança que já tinha se tornado fundamento da história da língua inglesa. Eles mostraram que o modelo do “deslocamento em cadeia” só funciona, no máximo, para as vogais semifechadas para fechadas, enquanto as outras mudanças nas vogais mais abertas (quadrado cinza no gráfico) ocorreram várias gerações mais tarde, em épocas diferentes segundo o dialeto, e, longe de participar num deslocamento em cadeia, de fato causaram fusões com outros vogais em algumas palavras. O que parece um fenômeno coerente quando visto de longe, provavelmente não é mais do que a acumulação através dos séculos de mudanças no sistema fonológico que têm pouca ou até nenhuma conexão causal entre si.

Gráfico do Stockwell (2002)

Matthew Giancarlo (2001) escreveu um artigo fascinante sobre a história do conceito da Grande Mudança Vocálica, mostrando como Jespersen e os seus contemporâneos e seguidores idealizaram a língua inglesa como um objeto unificado que evoluiu através to tempo e em direção a uma forma mais perfeita e racional – o inglês moderno padrão – e como esse conceito os ajudou a empacotar as multifacetadas evoluções no modelo simples que todo estudante da história da língua inglesa conhece.

Em muitos aspectos o debate sobre o conceito da GMV recapitula a perpétua divisão dos lumpers contra os splitters, os modelos idealizados contra a descritivismo, o abstrato contra o concreto. Entender completamente o que aconteceu pode até ser fora do nosso alcance; certamente não dá para representar uma verdade complexa num gráfico do estilo Jespersen. Talvez a GMV seja uma abstração esclarecedora, uma ficção útil; por outro lado talvez seja um conceito enganador, mostrando rastros de ideologias nacionalistas e coloniais, conforme a análise de Giancarlo. Talvez seja tudo isso ao mesmo tempo.

Buscas de Baixo Rendimento: Disponibilidade de Informação na Wikipédia Afeta Decisões de Turistas

Alguma vez você já buscou algo na Wikipédia ou no Google e não encontrou muitos conteúdos bons ou relevantes? Toda vez que isso acontece, nos dá uma pequena índice que o assunto sobre o qual buscamos nos informar não é importante ou interessante. No entanto, essas mensagens implícitas muitas vezes são enviesadas em contra da diversidade e em favor da cultura dominante, sua linguagem e suas tendências.

Um estudo recente (Hinnosaar, Hinnosaar, Kummer, & Slivko, 2019) usou um experimento controlado na Wikipédia para obter uma estimativa do tamanho do efeito que esses vieses podem ter num resultado economicamente relevante no mundo real. Os autores identificaram cidades espanhóis que tinham artigos de baixa qualidade nas Wikipédias em italiano, alemão e francês. Eles dividiram os artigos em um grupo de tratamento e um grupo de controle, ambos de 120 artigos. Depois adicionaram novas informações relevaãéntes aos artigos no grupo de tratamento (principalmente traduzindo das Wikipédias em espanhol e inglês), enquanto os artigos no grupo de controle não foram editados. Eles calculam que o número de turistas vindo da Itália, França e Alemanha (mais especificamente, o total de noites registrados nos hotéis da cidade) aumenta por uma média de 9% em cidades cujos artigos eles melhoraram, comparado com o grupo de controle.

Os autores concentram nas implicações na área de economia, especialmente a questão de por que as pessoas parecem não fornecer informações para a Wikipédia tanto quanto corresponderia ao incentivo econômico que parece existir. Mas o estudo também nos lembra que o viés informacional tem impactos reais e significativos no âmbito social. A maioria dos editores da Wikipédia são homens, e a Google tem incentivo para maximizar o seu lucro através de propagandas e acumular dados pessoais e não para apresentar informações de uma forma equilibrada. As culturas e línguas minoritárias são extremamente sub-representadas na internet como um todo. Então, não surpreende que as buscas com resultados de baixa qualidade afetam desproporcionalmente a pessoas que buscam informação sobre culturas minoritárias e/ou estrangeiras, sobre mulheres, pretos, indígenas, pessoas não brancas, LGBTQ, e àqueles que buscam informações em línguas outras que o inglês. Querendo ou não, toda vez que os criadores de conteúdo ignoram um assunto, e toda vez que um algoritmo dá preferência para assuntos populares à custa dos menos populares, correm o risco de exercer um efeito marginalizador.

O Escândalo da Wikipédia em Ânglico Escocês (Scots)

A situação com a Wikipédia em língua ânglica escocesa (Scots) está mudando o meu jeito de pensar sobre a internet e as línguas minoritárias.

O que aconteceu?

Alguns dias atrás, um post que viralizou no Reddit alegou que um único usuário — norte-americano e não falante de Scots — inundou a versão de Wikipédia nessa língua de artigos escritos em uma versão falsa dessa língua, que não passa de inglês com palavras substituídas usando um dicionário. (Este usuário parece ter agido com boas intenções; era criança quando começou a editar e já pediu desculpas). Outros usuários não falantes de Scots também fizeram um monte de contribuições de baixa qualidade. Aparentemente nunca existiu uma comunidade de autênticos falantes de Scots grande o suficiente para controlar a proliferação de “inglês aescocesado” e preencher o wiki de bons artigos em Scots autêntico. Agora a comunidade da Wikipédia tem que decidir como lidar com esta situação desastrosa: apagar o wiki inteiro, reverter o site a uma versão anterior, recrutar a comunidade de falantes de Scots para reabilitar os artigos?

Scots é uma das duas línguas minoritárias nativas da Escócia. Ao passo que o gaélico escocês é uma língua celta do mesmo grupo que o irlandês, o Scots é essencialmente um dialeto inglês, tendo divergido do inglês da Inglaterra já na época do inglês médio (Middle English) e se desenvolvido separadamente por vários séculos. Assim, o Scots divergiu do inglês padrão mais cedo do que as outras variedades de inglês falados nas Ilhas Britânicas e ao redor do mundo. Scots “largo” — isto é, com pouca influência do inglês padrão — é praticamente ininteligível para falantes de inglês que não têm experiência com ele. No entanto, existem variedades mistos que são bastante influenciados pelo inglês padrão.

É difícil saber exatamente quantas pessoas falam Scots. Dados do censo de 2011 apontam que aproximadamente 1,5 milhão de pessoas na Escócia afirmam que conseguem falá-lo. O futuro da língua é incerta, considerando que novas gerações talvez a abandonem em favor do inglês, enquanto outras pessoas podem usá-la até mais por causa do nacionalismo crescente ou simplesmente por serem orgulhosos da própria cultura. Em qualquer caso, a maioria das pessoas que falam Scots em casa e nas suas comunidades ainda prefere ler e escrever em inglês, especialmente para o tipo de conteúdos relevantes num contexto como a Wikipédia.

A Wikipédia representa um desafio particularmente difícil para as línguas orais que carecem de forma padrão

Notei que vários escoceses comentaram algo como “quero ajudar, mas não me considero qualificado para melhorar os artigos.” Não é só que os falantes nativos não têm a confiança nas suas habilidades na escrita. Existe um outro problema até mais fundamental com este projeto e outros similares. Não existe nem gramatica, nem vocabulário, nem ortografia padrão aceitados por todos os falantes. Existem variedades bem distintas do idioma (Doric, Ulster, Lallans). E as formas não são bem padronizadas nem dentro de uma variedade regional específica. Por isso, quando um editor potencial vê um artigo escrito com formas muito diferentes daqueles do seu próprio idioleto, é muito difícil contribuir ao texto. Então faz sentido que muitos falantes nativos são reticentes a contribuir, especialmente considerando o estado miserável em que a enciclopédia se encontrava e ainda se encontra. E agora a mensagem para os falantes nativos e, “nós criamos uma grande bagunça, mas agora fica pra vocês consertarem.”

Um caso de estudo sobre o comportamento na internet?

Parece que há três tipos de resposta a essa situação. Primeiro, ódio e assédio ao usuário que supostamente causou o problema, e denúncias sobre o estado (de fato, ofensivo) do conteúdo na Wikipédia Scots atual. Segundo, gente tirando sarro da situação bizarra e os artigos meio ridículos que parecem ser só inglês escrito com sotaque escocês. Terceiro, as discussões mais construtivas sobre o que fazer para melhorar a situação.

Ficamos fragmentados em pequenas comunidades, cada uma com seu próprio jeito específico e previsível de reagir a uma notícia como essa. Isso foi claro ao ver as reações na comunidade da Wikipédia, no Twitter, e nos subreddits r/linguistics, r/badlinguistics, r/scotland, etc. Como um prisma, a estrutura das comunidades online separa a nossa interação social em suas partes componentes, cada uma exibindo um caráter puro e limitado. Então, nos cabe ser proativo e nos informar de forma adequada, usando várias fontes e fazendo uso do pensamento crítico, favorecer a discussão construtiva e evitar de alimentar os trolls.

A Wikipédia e frequentemente citada como um dos grandes triunfos da bondade humana realizada na forma de colaboração online. (Todo o conhecimento da humanidade! Gratuito! Acessível por todo mundo, criado por qualquer um!) Mas essa visão não dá conta da instabilidade que existe sob a superfície. Apesar de que a grande maioria da informação na Wikipédia é, de fato, verdadeira e útil, é impossível eliminar o viés enquanto suas editores são um grupo pequeno e não muito diverso, que não representa bem a população de seus usuários e muitas vezes não inclui contribuições de pessoas das comunidades relevantes para os artigos que cobrem fenômenos históricos e culturais. Grandes desastres já ocorreram — notavelmente, o controle sobre a Wikipédia em língua croata foi tomada por neonazistas (existe uma Wikipédia em servo-croata, que é a forma internacional de essencialmente a mesma língua, onde as coisas parecem mais normais).

Isso representa uma ameaça para a língua?

O post original no Reddit sugeriu que o usuário ofensor pode ter feito “mais dano à língua Scots do que qualquer outra pessoa na História.” Se isso parece absurdo, imagina quantas pessoas devem ter visitado o site, visto os artigos aparentemente escritos em inglês com uma caricatura dum sotaque escocês, e concluído que Scots não é uma língua de verdade, e além do mais uma não-língua bastante ridícula. Isso ocorre no contexto agravante de séculos de marginalização. Apesar que eu acho que tudo isso pode ter um resultado mais positivo se acontecer uma reação forte e construtiva, deve ser óbvio: Não se deve colocar uma imitação fraca e inautêntica de uma outra cultura na internet como se fosse verdadeira!

Para saber mais sobre a língua ânglica-escocesa, sugiro o Centro para a Língua Scots, o curso da Open University, o Dicionário da língua Scots, ou a obra do grande poeta Robert Burns.

O que aprendi no Polyglot Conference em Ljubljana

Em outubro do ano passado, fui à Conferência de Poliglotas na cidade belíssima de Ljubljana, na Eslovênia. A conferência é um evento anual em que pessoas do mundo inteiro que gostam de aprender línguas se reúnem por um fim de semana. Tem palestrantes diversos falando sobre aprendizagem de línguas, ensino de línguas, linguística, e assuntos culturais ligados às línguas. Acima de tudo é uma ótima chance para conhecer gente com a mesma paixão pelas línguas. (Não precisa falar muitas línguas pra entrar – é suficiente ter vontade!)

Foi muito divertido e aprendi bastante. Eis as principais coisas que ficaram em minha memória:

Falar não é o único jeito de praticar uma língua

Há uma idéia popular na comunidade de poliglotas (apoiado por poliglotas famosos como Benny Lewis) que para aprender uma língua se deve falar desde o início, e falar bastante. Faz sentido, e também encaixa bem num discurso motivacional – não fique esperando, vai logo e fala – mas, como sou muito introvertido, não corresponde à minha experiência individual. Prefiro estudar sozinho, e não faz mal se não tenho muitas oportunidades pra falar todas as minhas línguas. Porém, mesmo se não falo sueco todo dia, seria bom saber que poderia.

Por isso, curti duas palestras sobre formas de praticar que podemos fazer sem precisar procurar gente com quem falar. Gareth Popkins falou sobre métodos para treinar a fala sozinho. Por exemplo, há uma técnica chamado “faithful retelling” (recontagem fiel). Você lê ou ouve um texto curto, faz anotações pra ajudar a lembrar o conteúdo, e depois tenta reproduzir o sentido do documento original. Outra técnica é a paráfrase: você tenta reescrever a frase usando palavras diferentes. A palestra de Lindsay Williams foi sobre a “capacidade esquecida”: a escritura. Ela nos lembrou que escrever em língua estrangeira é um jeito de praticar que é fácil, eficaz e conveniente: dá pra escrever em qualquer lugar, só precisa de papel e caneta!

Estudar línguas com um sistema

Outra idéia comum em várias palestras foi de estudar com um sistema: em vez de estudar o que dá vontade no momento, pode ser útil estabelecer metas e rotinas. Isso pode tomar várias formas. Por exemplo, você pode estabelecer uma meta de estudar um certo número de horas cada semana, ou de ter contato com uma certa língua todo dia, ou concentrar em línguas ou técnicas de estudo diferentes cada dia, semana, ou mês.

Olly Richards falou do desafio que ele fez a si mesmo de aprender italiano através de se expor a quantidades enormes de conteúdos compreensíveis em pouco tempo. Judith Meyer falou sobre o projeto de criar um curso de esperanto para a série Teach Yourself. Finalmente, Lýdia Machová falou sobre as suas experiências ajudando pessoas a estudar línguas e como ela as ajudou assegurando que cada uma tinha um sistema adequado ao individual. Depois da conferência, decidi adotar um sistema em que concentro em uma língua diferente cada mês.

Uma língua é vigorosa em função de como é usada, não quantos  falantes tem

Como é que podemos saber se uma comunidade linguística é saudável? Talvez as línguas se encontrem em situação forte quando têm muitos falantes nativos. Neste caso, o chinês mandarim seria a maior língua no mundo. Ou talvez o número total de falantes, sejam eles nativos ou não? Neste caso o inglês fica na primeira posição, o que é razoável. Mas esse modo de pensar é incompleto. Que tal o caso de uma língua falada por uma pequena comunidade, mas eles falam a língua em todas as situações e a utilização dela não está diminuindo? Claramente é mais forte que uma língua falada por mais gente, mas cujos falantes a abandonam a favor de outra língua dominante, ou tem vergonha de falá-la em público.

Vária palestras na conferência falaram sobre a situação de conservação das línguas minoritárias. Samanta Baranja falou – em esloveno – da comunidade roma (ciganos) na Eslovênia, e as tentativas de organizações locais de tornar a educação mais acessível a eles, utilizando a(s) língua(s) romani como ferramenta de inclusão em vez de exclusão. Claudia Ferigo falou da língua friulana, falada no nordeste da Itália (não é um dialeto do italiano!) e o festival Suns Europe de artes em línguas minoritárias. Anoushka Dufeil falou da marginalização de uma outra perspectiva: a luta das mulheres francófonas por inventar formas de se exprimir em francês sem sugerir desigualdade dos sexos (A Académie française parece atrapalhar bastante). Finalmente, Alex Rawlings exortou a toda a comunidade de poliglotas de usar os idiomas para destruir as Grenzen (fronteiras ou limites). Ele nos contou a história de quanto o ato de falar grego enriqueceu a experiência dele quando passou um verão na Grécia quando era menino. Destacou que, embora o inglês internacional predomine cada vez mais como forma de facilitar a comunicação entre nações, a diversidade lingüística é uma condição necessária para que as pessoas possam plenamente incorporar suas culturas. Também se opôs à tendência atual de criar conteúdos públicos e profissionais só em inglês, e de que as pessoas frequentemente até perdem a capacidade de usar a língua materna para falar de determinados assuntos.

Atualmente, qualquer um pode alcançar uma audiência global através da internet. Portanto, as línguas menores correm o risco de serem relegadas a usos domésticos, sociais e tradicionais, e de não serem usadas para funções como música popular, filmes, ciência, e blogues. Muitas universidades na Europa oferecem cursos de estudo em inglês que não são disponíveis na língua local, e muitos escritores nunca publicaram na língua materna.

Como um pequeno ato de oposição a essa tendência, decidi escrever este blog em pelo menos duas línguas: todos os conteúdos são disponíveis em inglês e português (considero que escrevo duas versões originais, não uma tradução), e talvez eu adicione outros idiomas no futuro.

Todo mundo estava nas redes sociais e nem sabia

Claro que sabia que tinha um grupo da conferência no Facebook. Mas não tinha a mínima idéia de que todo mundo estava conversando e coordenando atividades num grupo no Telegram. Eu nem tinha acesso à internet no meu telefone! Felizmente, Ljubljana é suficientemente pequeno que fiquei encontrando o pessoal da conferência por acaso na rua, e assim conheci alguns amigos.

No ano que vem, a conferência será em Fukuoka, no Japão. Espero que possa participar, mas estou trabalhando e terminando o doutorado ao mesmo tempo e não sei se vai dar tempo.