O que é estenotipia? Conheça a técnica por trás do closed caption

É muito provável que você já tenha assistido à televisão com aquelas legendas que reproduzem as falas em tempo real, acompanhando um âncora de jornal, uma vilã de novela, uma apresentadora de programa de auditório, um deputado, e por aí vai. O processo é chamado de closed caption (CC), também conhecido em português como “legendas ocultas”. É possível ativá-las pela funcionalidade de mesmo nome nos aparelhos de TV.

Mas como as legendas vão parar ali, sem perder nenhuma frase do que está sendo dito? Sim, porque boa parte da produção de legendas ocultas é produzida ao vivo. “Será que é um robô?”

Bem, a tecnologia está avançando, mas ainda não chegamos a tanto. O que existem são alguns métodos de registrar, no momento presente, as falas de alguém, o mais rápido possível.

Aqui, vamos abordar o mais tradicional entre esses métodos: a estenotipia. Sua adoção não é por acaso, porque se trata do mais confiável e do único que garante o altíssimo índice de acerto em legendas ocultas exigido pela ABNT (Associação Brasileira de Normas Técnicas), que impõe que 98% das palavras do closed caption sejam grafadas corretamente.   

“Impressão curta”

O termo “estenotipia” vem do grego “stenotypos”. “Stenos” significa “curto”, “abreviado”; e “typos”, impressão. A palavra designa a técnica pela qual se obtém o registro do que é falado por meio de uma máquina — o estenótipo. De forma simplificada, é um método de transformar rapidamente um áudio em texto.

Como o estenótipo permite essa agilidade? Porque, diferentemente da digitação comum, a estenotipia utiliza fonemas para formar palavras. No estenótipo, várias teclas são acionadas ao mesmo tempo, gerando palavras inteiras com apenas um toque, enquanto que, no teclado comum, cada letra é teclada separadamente. No estenótipo, temos 24 teclas que podem ser apertadas simultaneamente e que podem ser combinadas, formando diferentes fonemas.

Representação de um estenótipo

Exemplo de combinação de teclas para formação de letras:

KT = letra D

KTFP = letra G

Sabe quando o pianista toca aqueles acordes com várias teclas ao mesmo tempo, utilizando quase todos os dedos? Então, o princípio é parecido. No entanto, em vez de harmonia, a estenotipia gera várias palavras em um espaço de tempo bem curto.

Aprendendo um novo idioma

A estenotipia pode ser comparada também a um novo idioma. Para ter domínio da técnica, o aspirante a estenotipista tem de estudar, e muito — assim como quem quer aprender algum instrumento.

E o desafio não acaba por aí. Cada profissional deve construir seu próprio banco de dados desde o início de seu treinamento (com ajuda dos conceitos aprendidos na Teoria Brasileira de Estenotipia) e mantê-lo sempre atualizado.

A técnica difere da taquigrafia, que é mais antiga. A taquigrafia é uma escrita manual, que precisa depois ser novamente digitada no computador.

Outra técnica que vem sendo utilizada para transcrição de áudios é o reconhecimento de voz. Porém, ao ser utilizado ao vivo, o recurso ainda fica muito aquém da estenotipia, em termos de qualidade. O reconhecimento de voz pode ser feito por “repetição”, em que uma pessoa repete o que ouve para o sistema de RV fazer a transcrição (gerando um atraso maior da legenda, em relação à estenotipia). Ou, se for automático, elimina-se a necessidade deste profissional que repete, pois a transformação de fala em texto é feita por um sistema automático. Sua grande desvantagem em relação à estenotipia é que se perde a pontuação, as identificações e as possíveis sínteses, e os filtros que um estenotipista poderia realizar, durante um registro em que várias vozes se sobrepõem.

Mas o que de fato mantém a estenotipia como técnica vencedora é o índice de acerto a que outras técnicas não conseguem chegar: os 98% exigidos pela ABNT.

160 por minuto

Para atingir esse percentual, o profissional tem de “ralar”. A formação de um estenotipista leva em torno de quatro anos — desde que ele tenha habilidade e se dedique muito aos estudos. Ou seja, cerca de três horas por dia, cinco dias por semana. Só assim o aprendiz atingirá a velocidade desejada para começar a exercer a função, que é de 120 a 140 ppm (palavras por minuto) para arquivos pré-gravados, e a partir de 160 ppm para programações ao vivo (CC).

São padrões muito rigorosos, é verdade. Mas, por se tratar de uma atividade tão relevante, não poderia ser diferente. Porque as legendas ocultas até podem te ajudar, naquele momento em que você quer prestar atenção à TV e o bar está barulhento; no entanto, o real objetivo é tornar conteúdos acessíveis para pessoas com deficiência auditiva. É contribuir para um mundo mais inclusivo, mais justo.

Por isso, vem daí o orgulho que nós, do Grupo Steno, sentimos de nosso pioneirismo em estenotipia aqui no Brasil. Há cerca de 20 anos, quando começamos, a técnica (mecânica) era restrita a tribunais, com a transcrição naquelas fitinhas de papel. Em 1997, já estávamos inserindo CC no Jornal Nacional.

Daí em diante, a estenotipia só cresceu. Nós continuamos trabalhando para aprimorar cada vez mais a qualidade dos serviços que prestamos. Isto envolveu, entre outras medidas, investir em um departamento de controle de qualidade e na formação de nossos estenotipistas — que trabalham tanto para que ninguém perca nada do telejornal, da novela, do programa ou da sessão na Câmara.

E agora você já sabe: o mistério por trás das legendas ocultas é um profissional muito bem treinado!