O mito da "voz desafinada": o que a neurociência mostra sobre afinação — Luciana Melamed
LM
Material de leitura · Estúdio Vocal Luciana Melamed

O mito da
"voz desafinada":
o que a neurociência
mostra sobre afinação

"Eu sou desafinada" é uma das frases mais comuns que se diz sobre a própria voz — e uma das menos exatas. A ciência separa uma condição perceptiva rara da desafinação comum e treinável de quase todo mundo que canta fora do tom.

Curado por Luciana Melamed
Soprano · Estúdio Vocal · Curitiba
· Leitura de ~13 minutos · 6 capítulos
— Abertura —

Por que este material existe

Quase toda pessoa que chega a um estúdio de canto com a frase "eu sou desafinada" acredita que ela é um veredito — um fato fixo sobre o corpo, como a cor dos olhos.

É uma das primeiras coisas que se diz, em geral com uma risada meio sem jeito, antes de cantar uma única nota. A crença é funda o bastante para que muita gente sequer comece: parte-se do princípio de que cantar é um dom que se herda ou não, e a porta está fechada.

A pesquisa dos últimos vinte anos mostra algo mais útil — e mais esperançoso. "Desafinado" acabou virando um único rótulo popular esticado por cima de duas situações bem diferentes: uma de fato rara e perceptiva, a outra comum e treinável. Distinguir as duas muda o que "eu sou desafinada" realmente significa para você. Este texto percorre o que a evidência mostra, onde ela é sólida e onde ainda é frágil. As fontes estão citadas ao longo do texto e listadas ao final.

— Parte um —

Uma palavra para
duas coisas diferentes

Cantar afinado não é uma única habilidade. É uma corrente: o ouvido capta uma altura, o cérebro a guarda e a mapeia, e a laringe recebe a ordem de produzi-la. Uma falha em qualquer ponto dessa corrente aparece como o mesmo sintoma de superfície — uma nota que cai no lugar errado. É exatamente por isso que um único rótulo popular, "desafinado", foi esticado por cima de causas que quase nada têm a ver entre si.

A neurociência da audição traça uma linha firme entre dois grupos. O primeiro é o das pessoas com amusia congênita: uma condição vitalícia, principalmente perceptiva, em que o cérebro de fato tem dificuldade para diferenciar alturas. O segundo — muito maior — é o dos adultos sem treino vocal cuja audição é normal, mas cuja produção está descalibrada: percebem a altura sem problema e ainda assim cantam fora do tom.

A divisão que importa
~1,5% × 10–15% da população
~1,5% têm amusia congênita real; 10–15% são adultos "desafinados" cuja percepção está intacta. Peretz & Vuvan, 2017; Pfordresher et al., 2010.

A distinção não é acadêmica. Se o seu problema é perceptivo, o trabalho começa no ouvido. Se é de produção — e, estatisticamente, quase certamente é —, o trabalho começa na coordenação entre escuta e voz, que é uma habilidade motora, e habilidades motoras se constroem. O próximo capítulo mostra o quanto o primeiro grupo é pequeno.

— Parte dois —

Quão rara é a
desafinação de verdade

Durante décadas, o número que circulou na literatura era o de que cerca de 4% das pessoas seriam amúsicas. Esse valor acabou se revelando um artefato. Veio do antigo Distorted Tunes Test, uma triagem grosseira dos anos 1980 que reprovava com frequência pessoas sem treino musical — que ouviam perfeitamente bem, mas não tinham o vocabulário musical para passar no teste — e assim contava ouvintes normais como deficientes.

Honestidade científica

A afirmação repetida de que "4% das pessoas são desafinadas" não resiste a uma medição melhor. Trate-a como desatualizada, não como fato.

O instrumento que substituiu aquele teste é a Montreal Battery of Evaluation of Amusia (MBEA), desenvolvida por Isabelle Peretz e colaboradores no laboratório BRAMS, em Montreal. Ela avalia seis componentes do processamento musical — escala, contorno, intervalo, ritmo, métrica e memória musical — e aplica um corte deliberadamente estrito: a pessoa só é classificada como amúsica se pontuar dois desvios-padrão abaixo de uma população normal, o que na versão padrão significa abaixo de cerca de 21,6 em 30.

Peretz, Champod & Hyde, Annals of the New York Academy of Sciences, 2003

Quando esse teste rigoroso foi aplicado em larga escala — 20.850 participantes num estudo canadense —, a prevalência real da amusia congênita ficou em 1,5%, não 4%. Estudos independentes em outras regiões encontraram taxas ainda menores, em torno de 0,52% em algumas amostras universitárias.

Peretz & Vuvan, European Journal of Human Genetics, 2017 · Pradilla et al., Trends in Neuroscience and Education, 2020

Dois pontos sobre esse 1,5% valem nota. A condição é genuinamente hereditária — cerca de metade dos parentes de primeiro grau de uma pessoa amúsica (em torno de 46%) também são afetados, o que aponta para uma base genética real. E é genuinamente uma condição de minoria. Coloque isso ao lado do fato de que, em pesquisas, mais da metade dos adultos se descrevem como desafinados. A distância entre quem de fato é e a maioria que pensa que é resume todo este artigo. Quase todo mundo que diz "eu sou desafinada" não tem amusia nenhuma.

Peretz & Vuvan, 2017 · base da hereditariedade: Peretz, Cummings & Dubé, The American Journal of Human Genetics, 2007
— Parte três —

O que acontece quando
se canta fora do tom

Se apenas 1,5% das pessoas têm um déficit perceptivo, o que sai errado com todo o resto que canta desafinado? A pesquisa comportamental, conduzida em grande parte por Peter Pfordresher e Steven Brown, responde separando duas coisas que costumam ser confundidas: acurácia e precisão.

Acurácia é se a sua nota média cai no alvo. Precisão é se você acerta a mesma nota duas vezes — a consistência da voz de uma tentativa para a outra. As duas são independentes, e separá-las reorganiza por completo o retrato de quem "consegue" cantar.

Quando adultos sem treino são medidos imitando melodias curtas, a distribuição não se parece nada com "a maioria é desafinada":

Adultos sem treino, em números
~44% acertam na média, mas oscilam
~87% são acurados (a nota média cai a menos de um semitom do alvo); ~44% são "acurados, mas imprecisos"; só 10–15% são de fato imprecisos no alvo. Pfordresher et al., 2010.

Esse grupo do meio é a chave. Cerca de 44% das pessoas cantam a nota certa na média, mas oscilam em torno dela — o que, por dentro, soa exatamente como "eu não sei cantar", mesmo com o alvo sendo encontrado. Adultos sem treino desviam do alvo cerca de 1,3 semitom em média, contra mais ou menos 0,5 dos cantores treinados — uma diferença de coordenação e estabilidade, não de audição.

Pfordresher, Brown, Meier, Belyk & Liotti, "Imprecise singing is widespread", Journal of the Acoustical Society of America, 2010

E a minoria de fato imprecisa também não tem o ouvido quebrado. Pfordresher e Brown mostraram que os cantores desafinados não diferem dos acurados em testes puros de discriminação de altura, e têm extensão vocal normal. Seus erros são sistemáticos, não aleatórios — uma quinta consistentemente encolhida para uma terça, o mesmo intervalo errado toda vez —, o que é a assinatura de um mapa defeituoso entre a altura ouvida e o comando da laringe, e não de um ouvido defeituoso. A pesquisa chama isso de mismapping (mapeamento incorreto).

Pfordresher & Brown, "Poor-pitch singing in the absence of tone deafness", Music Perception, 2007

Há uma consequência contraintuitiva que vale nomear, porque explica muita frustração. Para esses cantores, acrescentar mais som externo — um piano martelando a nota certa ao lado deles — com frequência piora as notas individuais, em vez de melhorá-las, porque a informação corretiva é roteada pelo mesmo mapeamento defeituoso. É um indício de que o caminho não é "escutar com mais força". O próximo capítulo mostra por quê.

— Parte quatro —

O cérebro tem duas rotas
para a altura

A evidência mais curiosa vem do caso oposto. Acabamos de ver pessoas que ouvem a altura perfeitamente, mas não conseguem produzi-la. O inverso também existe: pessoas que não conseguem perceber conscientemente uma mudança de altura e cuja voz, ainda assim, corrige essa mudança automaticamente.

Em estudos de Sean Hutchins e Isabelle Peretz, adultos amúsicos eram muito ruins em distinguir conscientemente mudanças de altura em frases faladas — e, no entanto, ao serem pedidos para imitar essas mesmas frases em voz alta, reproduziam os contornos de altura muito melhor do que conseguiam discriminá-los. Cantavam de volta o que não conseguiam ouvir conscientemente.

Hutchins & Peretz, "Amusics can imitate what they cannot discriminate", Brain and Language, 2012

Fica mais nítido. Quando alguém sustenta uma vogal e a altura do próprio retorno é discretamente deslocada em um quarto de tom (25 cents), cantores amúsicos não conseguiam detectar a mudança conscientemente — mas a laringe compensava sozinha, com o mesmo tamanho e a mesma velocidade de resposta dos controles não amúsicos. O corpo rastreava uma altura à qual a mente consciente não tinha acesso.

Hutchins & Peretz, "Vocal pitch shift in congenital amusia", Brain and Language, 2013

É por isso que a pesquisa descreve um modelo de rota dupla para a altura, em paralelo vago com as rotas cerebrais de "ver para reconhecer" e "ver para agir" da visão:

  • uma rota ventral para a percepção consciente — reconhecer, comparar e memorizar alturas; é essa que está danificada na amusia;
  • uma rota dorsal para o controle motor da voz — a tradução rápida e em boa parte inconsciente de som em ação da laringe, conduzida por um feixe de substância branca chamado fascículo arqueado.

Num cantor desafinado, a rota dorsal funciona, mas está descalibrada. Num amúsico, a rota dorsal ainda dispara por reflexo, mas não consegue entregar seus dados a uma rota ventral avariada. A neuroimagem sustenta essa divisão: a integridade do fascículo arqueado tem sido associada à habilidade de afinação, e a amusia foi descrita como uma "síndrome de desconexão" entre as regiões auditivas e motoras.

Hutchins & Moreno, "The Linked Dual Representation model", Frontiers in Psychology, 2013 · Loui, Alsop & Schlaug, Journal of Neuroscience, 2009

De um jeito ou de outro, a lição prática é a mesma: a produção de altura é um sistema próprio, com treino próprio, separado de "ter bom ouvido". Mais uma evidência torna o ponto utilizável — quando cantores amúsicos puderam cantar em uníssono com uma voz gravada, em vez de sozinhos, seus erros de intervalo caíram de forma acentuada, de cerca de 81% para 64%. Dar ao sistema motor um alvo ao vivo para se ancorar rende mais do que pedir à percepção que trabalhe com mais afinco.

Tremblay-Champoux, Dalla Bella, Phillips-Silver, Lebrun & Peretz, "Singing proficiency in congenital amusia: imitation helps", Cognitive Neuropsychology, 2010
— Parte cinco —

Dá para treinar —
e há prova disso

Por muito tempo os manuais diziam que a amusia congênita era permanente e não treinável — aulas de canto e música na infância não tinham conseguido movê-la. Essa conclusão era real, mas foi obtida testando sempre a coisa errada: melodias musicais inteiras, carregadas de ritmo, letra e harmonia, que sobrecarregam justamente o sistema que está comprometido.

Quando o treino foi reduzido à psicofísica crua da altura, o resultado se inverteu. Num estudo controlado da University of Minnesota, 20 adultos amúsicos e 20 controles pareados treinaram ao longo de quatro sessões uma única tarefa: discriminar tons puros numa frequência baixa (500 Hz).

Whiteford & Oxenham, "Learning for pitch and melody discrimination in congenital amusia", Cortex, 2018

O que aconteceu obrigou a repensar o dogma do "permanente":

  • o grupo amúsico melhorou seus limiares de discriminação de altura tão rápido e tanto quanto os controles;
  • o treino a 500 Hz generalizou para frequências não treinadas (2.000 e 8.000 Hz) — não foi um truque restrito;
  • os ganhos transferiram para tarefas mais difíceis, de discriminação de melodias reais;
  • e num acompanhamento de um ano, as melhoras continuavam lá, sem nenhuma prática no intervalo.
Honestidade científica

Dois limites honestos. Primeiro, 1,5% não é zero — a amusia real existe, e esse tipo de treino afina limiares de percepção; não é uma cura instantânea para cantar. Segundo, treino de percepção sozinho não basta para o grupo de produção, bem maior: um estudo de neuroimagem mostrou que treinar pessoas a ouvir diferenças mínimas de altura melhorava a audição delas, mas não produzia nenhuma melhora em quão afinado cantavam. Ouvir melhor e cantar melhor são tarefas separadas.

Zarate, Delhommeau, Wood & Zatorre, PLoS ONE, 2010

Para o grupo de produção — os 10–15% —, o trabalho eficaz mira a voz diretamente. Duas abordagens têm a melhor evidência ao longo do tempo:

Feedback visual em tempo real (RTVF). Programas como o Sing & See (criado por Pat Wilson e colaboradores) desenham a sua altura como uma linha em movimento contra o alvo, deixando você corrigir pelos olhos e contornar o circuito embaralhado entre escuta e voz. Ao longo de programas de várias semanas, os ganhos são reais, ainda que modestos — num estudo, cerca de 18% dos usuários mostraram melhora objetiva; uma versão multimodal de 2022, que acrescentou a visualização da respiração, relatou ganhos médios de afinação em torno de 21%. A ressalva, dita com franqueza: esses ganhos podem sumir quando o apoio visual é retirado, a menos que ele seja desmamado de propósito, para que o corpo aprenda a confiar no próprio senso interno.

Wilson, Lee, Callaghan & Thorpe, Journal of Interdisciplinary Music Studies, 2008 · Piao & Xia, "Sensing the Breath", NIME, 2022

Exercícios de função vocal (VFEs). Um conjunto estruturado de sons sustentados e glissandos lentos que condicionam a laringe como uma habilidade motora atlética. Num programa de 10 semanas, com sessões semanais, isso ampliou de forma mensurável a extensão vocal utilizável dos participantes — esticar e contrair as pregas em glissandos lentos refina o mapa entre "a altura que quero" e "os músculos que a produzem", que é justamente a instabilidade por trás daquele grupo de 44% "acurados, mas imprecisos". (O estudo foi feito com cantores eruditos de pós-graduação, então mostra o mecanismo de construção de extensão, não um teste com desafinados sem treino especificamente.)

Guzman et al., Journal of Speech, Language, and Hearing Research, 2020

O fio condutor: tanto o caso perceptivo raro quanto o caso de produção comum respondem ao treino certo. Nenhum dos dois é uma porta fechada.

— Parte seis —

A desafinação
não é uma sentença

No Brasil, essa questão vive sob a fonoaudiologia, que fica no cruzamento entre acústica, neurologia e psicologia — e isso acaba importando para como a desafinação é tratada.

A ciência chegou aqui de forma rigorosa. A MBEA foi traduzida e validada psicometricamente para uso brasileiro por Nunes-Silva e Haase, com dados normativos estabelecidos para adolescentes de Belo Horizonte e alta confiabilidade (KR-20 ≈ 0,896) — de modo que o tal 1,5% pode ser diagnosticado localmente, em vez de estimado no escuro. Na clínica, as dificuldades de afinação costumam ser enquadradas no Processamento Auditivo Central (PAC), onde a ferramenta padrão é o treino auditivo intensivo e repetível — a mesma lógica que o trabalho psicofísico de Minnesota validou.

Nunes-Silva & Haase, Dementia & Neuropsychologia, 2012

Mas a contribuição brasileira também é psicológica, e é aqui que ela fala diretamente a quem está lendo. Pesquisadoras como Silvia Sobreira defendem que boa parte da desafinação adulta não é neurológica — é o resíduo de um desencorajamento precoce. Uma criança ridicularizada ao cantar — a crueldade casual do "não mia" — muitas vezes simplesmente para de cantar. Como cantar é uma habilidade motora que só se desenvolve com uso contínuo, essa parada congela a habilidade no nível de uma criança. Anos depois, a pessoa adulta abre a boca e de lá sai a coordenação crua daquela criança de oito anos que desistiu, e ela lê isso como prova de que "não consegue".

Sobreira, Desafinação Vocal (MusiMed, 2003) · Sobreira, Revista da ABEM, 2016

Há um ciclo cruel por cima disso. Como essas pessoas percebem a altura muito bem, ouvem as próprias notas fora do tom com clareza dolorosa. Essa consciência gera ansiedade; a ansiedade tensiona a laringe e aumenta a pressão subglótica; o enrijecimento piora a nota seguinte. É por isso que a boa prática aqui não é só exercício, mas um ambiente seguro o bastante para desfazer a tensão — trabalho suave do trato vocal, uma voz firme para cantar junto e a retirada do julgamento —, para que o sistema motor possa enfim se recalibrar.

O ponto de tudo isso é simples de dizer e bem sustentado: para a imensa maioria de quem se acha desafinado, a afinação é uma habilidade fisiológica que pode ser construída. O rótulo nunca foi um diagnóstico.

— Luciana Melamed —

Curadora deste material.
Estúdio Vocal · Curitiba e Online.

lucianamelamed.com
— Referências —

Estudos citados neste material

Peretz, I. & Vuvan, D. T. Prevalence of congenital amusia. European Journal of Human Genetics, 2017.
Peretz, I., Champod, A. S. & Hyde, K. Varieties of musical disorders: the Montreal Battery of Evaluation of Amusia. Annals of the New York Academy of Sciences, 2003.
Peretz, I., Cummings, S. & Dubé, M.-P. The genetics of congenital amusia (tone deafness): a family-aggregation study. The American Journal of Human Genetics, 2007.
Pradilla, I. et al. Congenital amusia and academic performance among Colombian university students. Trends in Neuroscience and Education, 2020.
Pfordresher, P. Q. & Brown, S. Poor-pitch singing in the absence of "tone deafness". Music Perception, 2007.
Pfordresher, P. Q., Brown, S., Meier, K. M., Belyk, M. & Liotti, M. Imprecise singing is widespread. The Journal of the Acoustical Society of America, 2010.
Hutchins, S. & Peretz, I. Amusics can imitate what they cannot discriminate. Brain and Language, 2012.
Hutchins, S. & Peretz, I. Vocal pitch shift in congenital amusia (pitch deafness). Brain and Language, 2013.
Tremblay-Champoux, A., Dalla Bella, S., Phillips-Silver, J., Lebrun, M.-A. & Peretz, I. Singing proficiency in congenital amusia: imitation helps. Cognitive Neuropsychology, 2010.
Hutchins, S. & Moreno, S. The Linked Dual Representation model of vocal perception and production. Frontiers in Psychology, 2013.
Loui, P., Alsop, D. & Schlaug, G. Tone deafness: a new disconnection syndrome? The Journal of Neuroscience, 2009.
Whiteford, K. L. & Oxenham, A. J. Learning for pitch and melody discrimination in congenital amusia. Cortex, 2018.
Zarate, J. M., Delhommeau, K., Wood, S. & Zatorre, R. J. Vocal accuracy and neural plasticity following micromelody-discrimination training. PLoS ONE, 2010.
Wilson, P. H., Lee, K., Callaghan, J. & Thorpe, C. W. Learning to sing in tune: does real-time visual feedback help? Journal of Interdisciplinary Music Studies, 2008.
Piao, Z. & Xia, G. Sensing the breath: a multimodal singing tutoring interface with breath guidance. Proceedings of the International Conference on New Interfaces for Musical Expression (NIME), 2022.
Guzman, M. et al. Does a systematic vocal exercise program enhance the physiologic range of voice production in classical singing graduate-level students? Journal of Speech, Language, and Hearing Research, 2020.
Nunes-Silva, M. & Haase, V. G. Montreal Battery of Evaluation of Amusia: validity evidence and norms for adolescents in Belo Horizonte, Brazil. Dementia & Neuropsychologia, 2012.
Sobreira, S. Desafinação Vocal. Rio de Janeiro: MusiMed, 2003 — e: Desafinação vocal: compreendendo o fenômeno. Revista da ABEM, 2016.
Da pesquisa à prática

É assim que eu ensino. Se você se reconheceu na frase "eu sou desafinada", o primeiro passo é agendar uma aula — ouvir onde a sua voz está hoje, em percepção e em produção, e mapear o que de fato a faria avançar, sem deixar o rótulo decidir nada de antemão.