Upptäck Whisper, det bästa tal-till-text-verktyget som utvecklats av OpenAI

Whisper speech to text

Hej företag, det är din ödmjuka tjänare, Nicolas, från AIonsultive.com!

Ohoj, idag är en dag av firande! Jag har äran, eller snarare privilegiet, att introducera dig till Whisper, detta underbarn inom tal-till-text-teknik, frukten av det otroliga arbetet av våra vänner på OpenAI. Du vet, de där genierna som födde kraftmonster som ChatGPT, GPT-3, 3.5, 4 och alla de andra i familjen… Den lilla historien säger att de sålde sina själar till vetenskapen, men det är en annan historia!

En transkription som är mer exakt än ett schweiziskt ur!

Så, vad har vår nya vän Whisper i beredskap för oss? Tja, till att börja med har den här lilla pärlan redan funnits i över ett och ett halvt år. Och vilken bedrift! Den tillhandahåller kirurgiskt exakta transkriptioner för alla dina språkliga behov: engelska, franska, italienska, spanska… Den kan göra allt. Om du behöver en transkribering av en YouTube-video eller en ljudinspelning på din smartphone på ett ögonblick, kommer Whisper att ta hand om allt. Och som grädde på moset översätter han till och med till engelska åt dig. Perfekt för att imponera på dina kompisar på aperitifen

.

Låt oss ge oss iväg till Whisper's underbara värld!

Kom igen, nog med prat, låt oss ta en närmare titt på vår vackra upptäckt. Whispers presentationssida är en veritabel katalog över teknisk skicklighet: transkription av tal som går snabbare än ljuset, innehåll på franska (men ja, du vet, det där språket med massor av obegripliga regler), K-Pop-videor (perfekt för att lära sig dansa samtidigt) och till och med ord som uttalas med accent! Hatten av för dig, Whisper

.

För de tekniskt kunniga som vill gräva under motorhuven erbjuder Whisper ett avsnitt som är dedikerat till dess interna motor. Tokens, kodning, avkodning, allt finns där. Det är nästan som en kurs i kvantmekanik, men oroa dig inte, du behöver inte vara Albert Einstein för att använda det grundläggande verktyget

.

Instruktioner för användning av Whisper

[På era platser, färdiga! Låt oss ge oss ut på en spännande resa till hjärtat av hur Whisper används. Först av allt, ingen panik, åtkomst är gratis på Google Collab, utan några begränsningar. Ja, du läste rätt, gratis. Så hur gör man det?

.

Här är länken till verktyget:https://colab.research.google.com/drive/1d6QsX4M3ySzOESzypk0g4APyTRPY2nTV

Steg 1:Vi kontrollerar GPU-åtkomsten på Google Collab

.

Första stoppet, GPU på Google Collab. Vad är poängen med det? För att ge vår transkription vingar. För att kontrollera klickar du bara i det övre högra hörnet på din Collab-sida på ”Ändra exekveringstyp”. Kontrollera att du är på ”T4” GPU och skriv, Ferrari of free GPUs

.

Steg 2: Vi installerar de nödvändiga biblioteken.

Andra stoppet, Python-biblioteken. Ingen panik, ett litet skript i den första cellen gör allt arbete åt dig. Det är som att ha en personlig kock som förbereder allt medan du njuter av din aperitif

.

Steg 3: Vi konfigurerar säkerhetskopieringsmappen.

Steg tre, definiera var Whisper ska lagra alla dessa värdefulla transkriptioner. Google Drive eller en annan lokal mapp, valet är ditt. Oroa dig inte om mappen inte finns, Whisper kommer att skapa den åt dig. Visst är det trevligt?

Steg 4: Vi väljer vår modell.

Steg fyra, välj din modell. Ett avgörande val, lite som att välja glassmak. Whisper erbjuder ett stort utbud, från ”liten” till ”stor”. ”Medium” är ofta en bra kompromiss mellan hastighet och precision

.

Steg 5: Videon som ska transkriberas väljs.

Femte stopp, välj den video som ska transkriberas. En YouTube-video eller en lokal fil, det är upp till dig. En enkel kopia och klistra in för YouTube, eller ett urval av den lokala filen, och det är det.

Steg 6: Vi konfigurerar utmatningsalternativen.

Sjätte stoppet, utmatningsalternativen. Vill du ha en vanlig text eller ett strukturerat format som JSON, VTT, SRT, TSV? Whisper anpassar sig efter dina önskemål

Steg 7: Vi kör modellen.

Sjunde steget, vi sätter på turbon. Klicka på knappen för att starta cellen och Whisper börjar arbeta. Lite tålamod och du har din transkription redo att gå

.

Steg 8: Utskriften analyseras och kontrolleras

Åttonde och sista steget, en snabb titt på transkriptet. Whisper är ett proffs, men ingen är perfekt. Några små manuella korrigeringar kan vara nödvändiga

.

Viskning, vår vardagliga vän

Whisper är förvånansvärt enkelt. Du behöver inte kunna Python eller pyssla med kod. Bara välj, klicka och så är det klart. Du får en transkription som är lika exakt som ett schweiziskt ur, redo att användas

.

Ett verktyg med tusen facetter

Whisper är som en schweizisk armékniv, den har massor av användningsområden. Vill du transkribera YouTube-videor till olika språk, översätta ljudinnehåll, ta anteckningar på möten eller föreläsningar? Den finns där för dig. Whisper är den perfekta följeslagaren för alla som behöver snabba, exakta transkriptioner. Och allt detta gör den medan du smuttar på kaffet. Vad mer kan man önska sig?

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *