Descubra o Whisper, a melhor ferramenta de conversão de voz em texto desenvolvida pela OpenAI

Whisper speech to text

Olá, empresa, é o seu humilde servo, Nicolas, do AIonsultive.com!

Ahoy, hoje é um dia de celebração! Tenho a honra, ou melhor, o privilégio de apresentar a vocês o Whisper, esse prodígio da tecnologia de fala para texto, fruto do incrível trabalho de nossos amigos da OpenAI. Você sabe, aqueles gênios que deram origem a monstros de poder como ChatGPT, GPT-3, 3.5, 4 e todo o resto da família… A pequena história diz que eles venderam suas almas para a ciência, mas isso é outra história!

Uma transcrição mais precisa do que um relógio suíço!

Então, o que o nosso novo amigo Whisper tem reservado para nós? Bem, para começar, essa pequena joia já existe há mais de um ano e meio. E que façanha! Ele fornece transcrições cirurgicamente precisas para todas as suas necessidades linguísticas: inglês, francês, italiano, espanhol… Ele pode fazer tudo. Se você precisar de uma transcrição de um vídeo do YouTube ou de uma gravação de áudio em seu smartphone em um piscar de olhos, o Whisper cuidará de tudo. E, para completar, ele até traduzirá para o inglês para você. Perfeito para impressionar seus amigos no aperitivo

.

Vamos decolar para o maravilhoso mundo do Whisper!

Vamos lá, chega de blá blá blá, vamos dar uma olhada mais de perto em nossa bela descoberta. A página de apresentação do Whisper é um verdadeiro catálogo de proezas tecnológicas: transcrição de discursos mais rápidos que a luz, conteúdo em francês (mas sim, você sabe, aquele idioma com muitas regras incompreensíveis), vídeos de K-Pop (ideal para aprender a dançar ao mesmo tempo) e até mesmo palavras pronunciadas com sotaque! Tiremos o chapéu para você, Whisper

Para os conhecedores de tecnologia que querem se aprofundar no assunto, o Whisper oferece uma seção dedicada ao seu mecanismo interno. Tokens, codificação, decodificação, está tudo lá. É quase como um curso de mecânica quântica, mas não se preocupe, você não precisa ser Albert Einstein para usar a ferramenta básica

.

Instruções para usar o Whisper

[Em suas posições, preparem-se! Vamos partir em uma jornada emocionante até o coração de como o Whisper é usado. Antes de tudo, não entre em pânico, o acesso é gratuito no Google Collab, sem restrições. Sim, você leu certo, gratuito. Então, como você faz isso?

Aqui está o link para a ferramenta:https://colab.research.google.com/drive/1d6QsX4M3ySzOESzypk0g4APyTRPY2nTV

Etapa 1:Verificamos o acesso à GPU no Google Collab.

Primeira parada, a GPU no Google Collab. Qual é o objetivo? Para dar asas à nossa transcrição. Para verificar isso, clique rapidamente no canto superior direito de sua página do Collab, em “Change execution type” (Alterar tipo de execução). Verifique se você está na GPU ‘T4' e digite a Ferrari de GPUs livres

.

Etapa 2: Instalamos as bibliotecas necessárias

.

Segunda parada, as bibliotecas Python. Não entre em pânico, um pequeno script na primeira célula faz todo o trabalho para você. É como ter um cozinheiro pessoal que prepara tudo enquanto você saboreia seu aperitivo

.

Etapa 3: Configuramos a pasta de backup.

Terceiro passo, defina onde o Whisper armazenará todas essas preciosas transcrições. Google Drive ou outra pasta local, a escolha é sua. Não se preocupe se a pasta não existir, o Whisper a criará para você. Isso não é bom?

Passo 4: Escolhemos nosso modelo.

Etapa quatro, escolha de seu modelo. Uma escolha crucial, um pouco como escolher o sabor do sorvete. A Whisper oferece uma grande variedade de modelos, desde o “pequeno” até o “grande”. O “médio” geralmente é um bom compromisso entre velocidade e precisão

.

Etapa 5: O vídeo a ser transcrito é selecionado.

Quinta parada, escolha o vídeo a ser transcrito. Um vídeo do YouTube ou um arquivo local, fica a seu critério. Um simples copiar e colar para o YouTube ou uma seleção do arquivo local, e pronto.

Passo 6: Configuramos as opções de saída.

Sexta parada, as opções de saída. Você deseja um texto simples ou um formato estruturado, como JSON, VTT, SRT, TSV? O Whisper se adapta aos seus desejos

Passo 7: Executamos o modelo.

Na sétima etapa, colocamos o turbo. Clique no botão para iniciar a célula, e o Whisper começa a trabalhar. Um pouco de paciência e você terá sua transcrição pronta para ser usada

.

Etapa 8: A transcrição é analisada e verificada

[Oitavo e último passo, uma rápida olhada na transcrição. O Whisper é um profissional, mas ninguém é perfeito. Podem ser necessárias algumas pequenas correções manuais

.

Sussurro, nosso amigo de todo dia

O Whisper é desconcertantemente simples. Você não precisa saber Python nem mexer com código. Basta selecionar, clicar e pronto. Você obterá uma transcrição tão precisa quanto um relógio suíço, pronta para ser usada

Uma ferramenta com mil facetas

O Whisper é como um canivete suíço, tem muitas utilidades. Quer transcrever vídeos do YouTube em diferentes idiomas, traduzir conteúdo de áudio, fazer anotações em reuniões ou palestras? Ele está lá para você. O Whisper é o companheiro ideal para quem precisa de transcrições rápidas e precisas. E ele faz tudo isso enquanto você toma seu café. O que mais você poderia querer?

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *