Vítor Augusto Nóbrega – USP
Renato Miguel Basso – UFSCar
(Publicado em 31 de Março de 2025)

Resumo: Nos estudos linguísticos, persiste uma discussão fundamental sobre o contraste entre liberdade e limitação na caracterização do conhecimento linguístico humano. De um lado, buscamos compreender por que nossa espécie segue trajetórias tão semelhantes no desenvolvimento de uma língua; de outro, por que tal conhecimento se manifesta de formas tão diversas, considerando o vasto número de línguas identificadas. Essas questões nos convidam a refletir sobre a validade da hipótese de que há limites biológicos para a linguagem, não apenas no que se refere à relativa uniformidade de seu desenvolvimento, mas, sobretudo, à ideia de que os padrões estruturais capazes de compor esse conhecimento também seriam determinados por fatores de natureza biológica. Tendo esse pano de fundo como referência, o presente artigo discute a possibilidade da existência de “línguas impossíveis”, ou seja, sistemas cujas gramáticas escapariam às regras que regem aquilo que pode ser convertido em conhecimento linguístico por um indivíduo humano. Dado que se trata de um tema ainda controverso nos estudos linguísticos, buscamos contextualizar o debate e problematizar a questão com base em alguns elementos que se revelam centrais para uma compreensão mais aprofundada dos aspectos biológicos da capacidade linguística humana.
Atualmente, de acordo com a UNESCO, há cerca de 7.000 línguas diferentes no mundo, tanto línguas orais quanto sinalizadas. Por mais que seja difícil precisar esse número, — seja porque nem sempre é fácil diferenciar línguas entre si, seja porque muitas vezes é difícil alcançar e descrever línguas faladas por populações isoladas —, o exercício de contabilizar as línguas que existem nos revela a gigantesca diversidade linguística do planeta.
Essa variedade levanta uma série de questões intrigantes. Por exemplo, sabemos que, quanto mais recuamos no tempo, maior era a diversidade linguística. Estima-se que, quando os europeus invadiram as Américas, fossem faladas algo em torno de 1.200 línguas apenas na região que corresponde ao atual território brasileiro, muitas das quais foram vítimas da hecatombe que assola as populações nativas desde então (Rodrigues, 2005). Hoje, esse número se reduziu a algumas poucas centenas. Nessa mesma linha de raciocínio, várias línguas estão deixando de ser faladas por suas populações, seja em razão do extermínio de seus falantes, da assimilação forçada em centros urbanos ou da imposição de outras línguas.
Ao lado dessas preocupantes questões políticas, há perguntas mais diretamente ligadas ao que a diversidade linguística pode mostrar, tanto sobre nossa capacidade para adquirir e operar com línguas, quanto sobre as demais faculdades intelectuais humanas. Diante dessa enorme variedade de línguas, a Linguística há tempos já mostrou que não existe língua mais difícil que outra, uma vez que qualquer criança – livre de patologias – pode adquirir a(s) língua(s) da sua comunidade sem dificuldades, e essa aquisição se dá de modo semelhante, não importa qual seja a língua envolvida (cf. Grolla; Figueiredo-Silva, 2014). Ou seja, a estonteante diversidade linguística é claramente uma janela para o que é de fato uma língua humana, que humanos têm condições de adquirir e usar em diversas funções, como para se comunicar ou para organizar seus pensamentos.
Mas será que há algo em comum entre essas 7.000 línguas e sua diversidade? Ou será que elas variam de forma arbitrária, sem haver nada que as aproxime? Essa última pergunta divide os linguistas em dois grandes grupos, que podem ser caracterizados, de modo bastante simplificado, da seguinte forma: (i) aqueles que admitem que há “uma selva lá fora”, segundo os quais as línguas do mundo variariam de modo indiscriminado; e (ii) aqueles que defendem a existência de uma base estrutural comum a todas as línguas, de modo que a variação entre as estruturas inferidas das línguas descritas, embora presente, estaria confinada aos limites dessa base. Podemos, nesse último caso, imaginar que haveria uma “língua-tronco”, tal como uma célula-tronco, a partir da qual diferentes línguas poderiam ser criadas. Trocando em miúdos: será que, por trás dessa grande diversidade de línguas, há uma potencialidade de variação sem limites, ou há princípios que guiam o que pode ser propriamente uma língua?
Como você pode imaginar, não é nada fácil responder a essa questão, e há algumas razões que explicam essa dificuldade. Por exemplo, não conseguimos ainda documentar e analisar todas as línguas disponíveis, e assim pode ser que haja alguma língua que, de fato, tenha características que nenhuma outra tenha. Por outro lado, nem todos os linguistas concordam sobre o que exatamente seria relevante como algo a ser compartilhado pelas línguas, assim como as técnicas de análise não são idênticas e não há um consenso acerca dos métodos empregados para a descrição de seus padrões. E, talvez ainda mais complicado, há diferentes e incompatíveis perspectivas teóricas que podemos empregar para realizar tal tarefa – um traço comum da teorização nas humanidades –, e naturalmente escolher entre elas é algo um tanto complexo.
Porém, ao lado desse quadro desafiador, vamos argumentar que é sim possível encontrar características sugestivamente comuns às línguas, e que sinalizam a existência de um plano de base para a criação de línguas (humanas). Respeitar esse plano de base torna um sistema em uma língua humana possível, e isso nos leva imediatamente a pensar sobre “línguas impossíveis”, ou seja, sistemas que até parecem línguas, mas que humanos simplesmente não seriam capazes de processar ou adquirir de modo espontâneo.
Entre as características que definem uma língua humana possível está um fato aparentemente banal, mas que esconde grande complexidade: línguas humanas possíveis são aquelas naturalmente adquiridas por seres humanos. Afinal, o fato de bebês adquirirem as línguas documentadas sem dificuldades, sem pedagogia ativa por parte de seus cuidadores e de modo consideravelmente sistemático, as torna prontamente línguas possíveis. Porém, como saber que tipo de sistema um bebê não teria, em tese, condições de adquirir? Obviamente, por motivos éticos, não podemos fazer experimentos diretos nesse contexto. Entretanto, podemos testar o modo como humanos adultos reagem ao serem apresentados a uma regra linguística anômala, que não se conforma ao que sabemos sobre o funcionamento das línguas naturais.
Entre as regras que os linguistas consideram fundamentais para as línguas humanas possíveis está o mecanismo por trás da organização estrutural de suas frases – as relações entre as palavras em uma frase não se dão por proximidade linear. Muito embora, nas línguas orais, realizemos uma palavra depois da outra, de modo serial, as estratégias envolvidas na criação e no processamento das relações entre as palavras levam em conta um arranjo estrutural invisível. As palavras, deste modo, não estão simplesmente dispostas uma diante da outra, mas se agrupam em conjuntos que são incluídos em outros conjuntos, dando origem a uma organização hierárquica. Em síntese: formar uma frase é forjar uma estrutura. Como esse é um ponto importante, vale a pena insistir: apesar de ouvir (ou ver) os elementos de uma língua numa sequência temporal linear, um depois do outro, a interpretação desses elementos não é linear, mas se dá por alguma estrutura (invisível) que organiza tais elementos.
Esse arranjo estrutural pode ser observado em qualquer frase de uma língua. Por exemplo, se tomarmos as palavras mãe, proteger, e filho, percebemos que sua disposição em uma frase remete a uma estrutura abstrata, que regula não apenas a relação entre as palavras mãe e filho, dado que “a mãe protegeu o filho” e “o filho protegeu a mãe” envolvem diferentes significados, mas também a exclusão de certas combinações, como “*a protegeu o filho mãe”. Essa base para a construção de línguas parece ignorar a proximidade linear entre as palavras, como pode ser visto também nas relações entre preço, pacote e bala em (1):
(1)
a. as balas
b. os pacotes de balas
c. o preço dos pacotes de balas
A relação entre essas palavras não é determinada por sua proximidade, ou seja, o fato de balas vir após pacotes e de pacotes vir após preço. Na verdade, a relação entre elas é mediada por uma estrutura abstrata, que podemos observar nas relações de concordância que envolvem as palavras de uma frase, por mais distantes que estejam. Se a relação de concordância fosse mediada por proximidade linear, deveríamos esperar que a relação de número e gênero de estar e de alto levasse em conta a palavra mais próxima, que seria balas:
(2) O preço dos pacotes de [balas]PL-FEM estãoPL muito altasPL-FEM.
No entanto, (2) soa inadequada em português. Sua versão bem formada envolve uma relação de dependência que se estabelece com um item linearmente distante do verbo e do adjetivo, preço, como em (3).
(3) [O [preço]SG-MASC dos pacotes de balas] estáSG muito altoSG-MASC.
Outro fenômeno que ilustra a dependência estrutural das línguas é a co-referência pronominal. Tomemos como exemplo a sentença em (4).
(4) O pai do Pedro se encontrou com o presidente.
O pronome se deve se ligar a um dos nomes da frase para estabelecer seu referente. Mas a escolha desse nome não é aleatória nem definida por proximidade linear. Se fosse assim, deveríamos esperar que o nome mais próximo linearmente ao pronome – neste caso, Pedro – fosse a resposta para uma pergunta como Quem se encontrou com o presidente?, o que claramente não é o caso. O que está ligado ao pronome se não é o Pedro, mas o nome mais distante linearmente, ou seja, o pai (do Pedro).
Tal como se observa em (3), com o fenômeno da concordância, o nome linearmente mais próximo não corresponde ao nome estruturalmente mais saliente para estabelecer essa relação de ligação. Na verdade, a relação entre essas palavras envolve uma estrutura implícita, como se cada nome na frase (4) estivesse contido em uma caixa, sobre a qual outras caixas são empilhadas. Esse exemplo mostra que, apesar de linearmente próximo, o nome Pedro está estruturalmente menos saliente do que o nome pai. Isso porque Pedro corresponderia a uma “caixa” muito mais distante em profundidade no empilhamento do que pai, como representado na Figura 1.

Mas se dependência estrutural é de fato o caso, podemos retomar nossa questão sobre línguas impossíveis e perguntar o seguinte: o que aconteceria se expuséssemos um humano a uma língua que não respeita regras estruturais, tal como aquela ilustrada na Figura 1?
Os pesquisadores Neil Smith, Ianthi Tsimpli e Jamal Ouhalla (1993) testaram essa possibilidade num experimento bastante interessante. Eles criaram uma língua artificial, a que chamaram epun, que incluía regras “impossíveis”, ou seja, regras que ignoravam relações estruturais, e que eram baseadas unicamente na proximidade linear entre as palavras. O candidato escolhido para o teste foi o poliglota Christopher, portador da Síndrome de Savant, uma condição rara em pessoas com déficits cognitivos, mas dotadas de habilidades excepcionais em áreas específicas. No caso de Christopher, sua capacidade excepcional estava relacionada à sua habilidade extraordinária para aprender línguas. No experimento, os pesquisadores apresentaram a Christopher construções que incluíam uma regra anômala: a sufixação de uma partícula enfática à terceira palavra na sequência linear da sentença, independentemente de qual fosse sua categoria.
Os exemplos abaixo ajudam a entender melhor de que isso se trata e de como eram as frases do experimento. Imagine que, no português, houvesse uma regra que incluísse um sufixo para expressar ênfase, mu, cujo significado fosse equivalente a “o falante expressa certeza com relação à afirmação em questão”. Imagine, agora, que a distribuição desse sufixo fosse aritmeticamente definida, isto é, caracterizada pela contagem de palavras em uma sequência: o sufixo enfático mu deveria ser afixado à palavra ocupando a terceira posição linear na sequência de palavras da frase, como em (5a) e (5b); caso a frase tivesse menos do que três palavras, mu deveria ocorrer na posição final, como em (5c).
(5)
a. O presidente veio-mu pra São Paulo.
b. O presidente de-mu Angola veio pra São Paulo.
c. Ele dançou-mu.
Como resultado desse experimento, Christopher teve extrema dificuldade para inferir essa regra, não apenas para aplicá-la conforme esperado na língua inventada, mas também para corrigir erros quando ela era violada. É interessante observar que os autores incluíram, como grupo de controle, quatro estudantes do primeiro ano de Linguística, falantes nativos de inglês, sem qualquer patologia ou habilidade específica que pudesse dificultar ou facilitar a aprendizagem de novas línguas. Assim como Christopher, os participantes do grupo de controle não obtiveram êxito em decodificar o padrão implícito na regra, que independe de critérios estruturais. Essa dificuldade em inferir regras que não fazem referência à estrutura sugere que o conhecimento linguístico humano é guiado por princípios baseados em arranjos estruturais (Fitch, 2019). Segundo os pesquisadores, o experimento com Christopher indica que os humanos tendem a ignorar regras lineares de organização linguística.1
É relevante destacar que a regra não estrutural envolvida no epun nada tem a ver com regras de línguas naturais que fazem referência a posições fixas na frase. Um exemplo é a chamada “regra verbo-2 (V2)” de línguas como o alemão, em que o verbo de uma oração principal declarativa deve ocorrer sempre na segunda posição; porém, na segunda posição estrutural. Considere a frase declarativa do alemão em (6), explorada em Gabriel, Müller e Fischer (2018). Nas orações principais, o alemão permite que diferentes grupos de palavras, com diferentes funções sintáticas, apareçam antes de um verbo finito, seja um sujeito (S), como em (6a), um objeto (O), como em (6b), ou um advérbio (Adv), como em (6c).
(6)
a. [S Dieser Student] [V besteht] [O das Examen] [Adv zweifellos].
este estudante passa(rá) o exame sem-dúvidas
‘Este estudante passará inegavelmente no exame’.
b. [O Das Examen] [V besteht] [S dieser Student] [Adv zweifellos].
c. [Adv Zweifellos] [V besteht] [S dieser Student] [O das Examen].
Entretanto, uma sentença se tornará inaceitável em alemão caso haja mais de um grupo de palavras antes do constituinte verbal, tal como ilustrado em (7), em que tanto um advérbio quanto o sujeito antecedem o verbo.
(7) *[Adv Zweifellos] [S dieser Student] [V besteht] [O das Examen].
O que está em jogo no alemão não é o número de palavras que compõem a frase, mas a relação estrutural entre suas peças, seja um sujeito ou um objeto e o verbo, como em (6a) e (6b), respectivamente, ou um advérbio e o verbo, como em (6c). Em todos os casos, o verbo deve aparecer na segunda posição (estrutural). A dependência estrutural se torna ainda mais evidente se incrementamos qualquer uma das peças com mais material linguístico, que, apesar de aumentar o número de palavras da frase, não afetará a restrição estrutural de que o verbo deve aparecer na segunda posição, como exemplificado em (8).
(8) [S Dieser Student aus Hamburg][V besteht] [O das Examen] [Adv zweifellos].
este estudante de Hamburgo passa(rá) o exame sem-dúvidas
‘Este estudante de Hamburgo passará inegavelmente no exame’.
Se essa hipótese sobre o papel da dependência estrutural na criação de línguas estiver correta, a variação translinguística, pelo menos do ponto de vista estrutural, é de fato restrita: línguas possíveis não podem ser linearmente organizadas. É particularmente interessante notar que não há, em princípio, nada que pudesse impedir que línguas se organizassem linearmente, e isso leva muitos linguistas a argumentarem a favor de um plano de base biologicamente determinado para a construção de línguas, algo como uma “gramática universal”, que pode ser vista como a expressão de uma faculdade intelectual humana voltada para a linguagem, a qual delimita as possibilidades de línguas, como defendido há décadas pelo linguista Noam Chomsky.
Dando mais um passo nessa direção, podemos ainda imaginar que tal plano de base delimita os tipos de estímulos que podem ser transformados em conhecimento linguístico por um humano, e, portanto, restringe o que pode ser uma língua possível. Haveria, nesse sentido, certos domínios da experiência humana que são construídos através de uma base biologicamente determinada, dentre eles, a própria linguagem. A experiência humana seria, de acordo com essa visão, constituída de aspectos do ambiente circunscritos pela composição anatômica e cognitiva da espécie, que limitaria aquilo que a espécie pode experienciar e, então, converter em conhecimento. Logo, se um estímulo aparentemente linguístico foge àquilo que pode ser lido por essa base biológica e transformado em conhecimento, será ignorado, e, consequentemente, irá compor o que chamamos de “línguas impossíveis”. Impossíveis porque não podem ser espontaneamente convertidas em conhecimento linguístico pela espécie humana.
Para um primata não humano, como um chimpanzé, as línguas humanas são “línguas impossíveis” pois eles não são capazes de espontaneamente adquiri-las, ou seja, de transformá-las em conhecimento, uma vez que carecem de uma base biológica para tanto (Petitto, 2005). Da mesma forma, os sistemas de vocalização primata correspondem a uma “língua impossível” para um bebê humano, tendo em vista que sua organização estrutural (que é guiada por linearidade) é alheia ao infante, cuja biologia tenta transformar em conhecimento aquilo que se estrutura por meio de um arranjo hierárquico.
A questão sobre língua impossível tem inúmeros desdobramentos, e, neste artigo, abordamos exclusivamente a questão estrutural, mas perguntas parecidas e igualmente desafiadoras poderiam ser feitas sobre os sons (ou sinais) de uma língua. Por exemplo, línguas possíveis fariam uso de sons (ou sinais) não passíveis de um humano realizar facilmente? Quais seriam eles exatamente? Ainda mais complexa é a questão sobre o significado e as peças que compõem o léxico humano. Martina Wiltschko, em seu trabalho de 2014, considera explicitamente essa questão se perguntando se há limites sobre o tipo de significado que as línguas poderiam codificar em sua estrutura. Poderíamos pensar em distinções de significado que seriam impossíveis de um humano adquirir caso aparecessem numa língua? Por que contrastes relevantes para a espécie, como venenoso vs. não venenoso, por exemplo, como perguntam Leivada e Barceló-Cobljin, em seu trabalho de 2020, não são gramaticalizados nas línguas da mesma forma que contrastes como singular vs. plural? Essas questões são fascinantes e temas de importantes pesquisas que vêm sendo realizadas atualmente.
Voltando ao início deste artigo, a diversidade linguística nos mostra a enorme variedade possível dentro dos limites das línguas possíveis, e também que a variação entre línguas não deve ser ilimitada, ainda que haja um grande espaço de possibilidades, nos levando a considerações estruturais e até mesmo biológicas. Estudar o que é impossível num espaço de muitas possibilidades é uma estratégia para conhecer o alcance e os limites desse domínio, e o mesmo naturalmente se aplica à investigação da capacidade linguística humana.
FICHA CATALOGRÁFICA
N628ㅤNÓBREGA, Vítor Augusto, BASSO, Renato Miguel
ㅤㅤㅤGramática do impossível: há regras que escapam à capacidade linguística humana? / Vítor Augusto Nobrega, Renato Miguel Basso – São Paulo: NÓS DA LINGUÍSTICA, 2025. 1 p.
ISSN: 3086-2086
ㅤㅤㅤ1. Estudos linguísticos 2. Capacidade linguística humana 3. Conhecimento linguístico humano
ㅤㅤㅤI. Nobrega, Vitor Augusto II. Basso, Renato Miguel III. Gramática do impossível: há regras que escapam à capacidade linguística humana?
ㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤCDD: 401.1
ㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤCDU: 401.1:401.91
Referências
FITCH, W. T. Dendrophilia and the evolution of syntax. In: BOË, L-J. et al. (Org.) Origins of human language: Continuities and discontinuities with nonhuman primates. Berlim: Peter Lang, 2019, p. 305-328.
GABRIEL, C.; MÜLLER, N.; FISCHER, S. Grundlagen der Generativen Syntax: Französisch, Italienisch, Spanisch. Berlim: De Gruyter, 2018.
GROLLA, E. B.; FIGUEIREDO-SILVA, M. C. Para conhecer Aquisição da Linguagem. São Paulo: Contexto, 2014.
KALLINI, J.; PAPADIMITRIOU, I.; FUTRELL, R.; MAHOWALD, K.; POTTS, C. Mission: Impossible Language Models, 2024 (disponível em: arXiv:2401.06416).
LEIVADA, E.; BARCELÓ-COBLJIN, L. Why don’t languages grammaticalize [±poisonous]? Biolinguistics, v. 14, 2020, p. 51-58.
PETITTO, L-A. How the brain begets language. In: McGILVRAY, J. (Org.) The Cambridge Companion to Chomsky. Cambridge: CUP, p. 84-101.
RODRIGUES, A. D. Sobre as línguas indígenas e sua pesquisa no Brasil. Ciência e Cultura, v. 57, n. 2, 2005, p. 35-38.
SMITH, N; TSIMPLI, I-M; OUHALLA, J. Learning the impossible: The acquisition of possible and impossible languages by a polyglot savant. Lingua, v. 91, 1993, p. 279-347.
WILTSCHKO, M. The Universal Structure of Categories: Towards a formal typology. Cambridge: CUP, 2014.
Sugestões de leitura
DEUTSCHER, G. O desenrolar da linguagem. São Paulo: Mercado de Letras, 2014.
MARTIN, S. Línguas impossíveis: o que são? De onde vêm? Revista Linguística Rio,v. 10, edição especial, 2024, p. 9-22.
MORO, A. Impossible languages. Cambridge, MA: MIT Press, 2016.
NÓBREGA, V. A. A vista de cima da torre: Babel, seus muros e a selva lá fora. Divulgando Linguística, Departamento de Linguística UFRJ, p. 1 – 9, 26 jun. 2023. Disponível em: https://lefufrj.wordpress.com/2023/06/26/a-vista-de-cima-da-torre-babel-seus-muros-e-a-selva-la-fora/
- Curiosamente, até mesmo modelos de linguagem baseados em inteligência artificial, como o ChatGPT, apresentaram dificuldades em processar línguas cuja organização desconsidera um arranjo estrutural (cf. Kallini et al., 2024); assunto que deve ganhar maior visibilidade nos próximos anos. ↩︎
(Baixe a versão em pdf do texto)
[Outros textos de divulgação: leia aqui].

Deixe um comentário