Odkryj Whisper, najlepsze narzędzie do zamiany mowy na tekst opracowane przez OpenAI

Whisper speech to text

Witaj towarzystwo, tu twój uniżony sługa, Nicolas, z AIonsultive.com!

.

Ahoj, dziś jest dzień świętowania! Mam zaszczyt, a raczej przywilej, przedstawić wam Whisper, ten cudowny wynalazek technologii Speech-to-Text, owoc niesamowitej pracy naszych przyjaciół z OpenAI. Wiesz, tych geniuszy, którzy dali początek potworom mocy, takim jak ChatGPT, GPT-3, 3.5, 4 i cała reszta rodziny… Mała historia mówi, że sprzedali swoje dusze nauce, ale to już inna historia!

Transkrypcja dokładniejsza niż szwajcarski zegarek!

Więc, co nasz nowy przyjaciel Whisper ma dla nas w zanadrzu? Cóż, na początek ten mały klejnot istnieje już od ponad półtora roku. I co za wyczyn! Zapewnia chirurgicznie precyzyjne transkrypcje dla wszystkich potrzeb językowych: angielskiego, francuskiego, włoskiego, hiszpańskiego… Może zrobić to wszystko. Jeśli potrzebujesz transkrypcji filmu z YouTube lub nagrania audio na smartfonie w mgnieniu oka, Whisper zajmie się wszystkim. A na dodatek przetłumaczy je nawet na język angielski. Idealny do zaimponowania kolegom przy aperitifie

.

Wyruszmy do wspaniałego świata Whisper!

.

No dalej, dość bla bla, przyjrzyjmy się bliżej naszemu pięknemu odkryciu. Strona prezentacyjna Whisper to istny katalog technologicznych możliwości: transkrypcja przemówień szybszych niż światło, treści po francusku (ale tak, wiesz, ten język z mnóstwem niezrozumiałych zasad), teledyski K-Pop (idealne do nauki tańca w tym samym czasie), a nawet słowa wymawiane z akcentem! Czapki z głów, Whisper

Dla zaawansowanych technicznie, którzy chcą zagłębić się pod maskę, Whisper oferuje sekcję poświęconą swojemu wewnętrznemu silnikowi. Tokeny, kodowanie, dekodowanie, wszystko tam jest. To prawie jak kurs mechaniki kwantowej, ale nie martw się, nie musisz być Albertem Einsteinem, aby korzystać z podstawowego narzędzia

.

Instrukcje korzystania z Whisper

[Na miejsca, gotowi! Wyruszmy w ekscytującą podróż do serca tego, jak Whisper jest używany. Po pierwsze, nie panikuj, dostęp do Google Collab jest bezpłatny, bez żadnych ograniczeń. Tak, dobrze przeczytałeś, darmowy. Więc jak to zrobić?

Oto link do narzędzia: https://colab.research.google.com/drive/1d6QsX4M3ySzOESzypk0g4APyTRPY2nTV

Krok 1:Sprawdzamy dostęp GPU w Google Collab.

Pierwszy przystanek, GPU w Google Collab. Jaki jest tego cel? Aby dodać naszej transkrypcji skrzydeł. Aby to sprawdzić, wystarczy kliknąć w prawym górnym rogu strony Collab na „Zmień typ wykonania”. Sprawdź, czy jesteś na GPU „T4” i wpisz Ferrari wolnych GPU

.

Krok 2: Instalujemy niezbędne biblioteki.

Drugi przystanek, biblioteki Pythona. Nie panikuj, mały skrypt w pierwszej komórce wykona całą pracę za ciebie. To jak posiadanie osobistego kucharza, który przygotowuje wszystko, podczas gdy ty delektujesz się aperitifem

.

Krok 3: Konfigurujemy folder kopii zapasowej.

[Krok trzeci: zdefiniuj, gdzie Whisper będzie przechowywać wszystkie cenne transkrypcje. Dysk Google lub inny folder lokalny, wybór należy do Ciebie. Nie martw się, jeśli folder nie istnieje, Whisper utworzy go dla Ciebie. Czyż to nie miłe?

.

Krok 4: Wybieramy nasz model.

[Krok czwarty, wybór modelu. Kluczowy wybór, trochę jak wybór smaku lodów. Whisper oferuje szeroką gamę modeli, od „małych” do „dużych”. „Średni” jest często dobrym kompromisem między szybkością i precyzją

.

Krok 5: Wybrano wideo do transkrypcji

.

Piąte zatrzymanie, wybierz wideo do transkrypcji. Film z YouTube lub plik lokalny, to zależy od Ciebie. Proste kopiowanie i wklejanie na YouTube lub wybór lokalnego pliku i to wszystko.

Krok 6: Konfigurujemy opcje wyjściowe.

Szósty przystanek, opcje wyjściowe. Czy chcesz zwykły tekst lub format strukturalny, taki jak JSON, VTT, SRT, TSV ? Whisper dostosowuje się do Twoich życzeń

Krok 7: Uruchamiamy model.

Siódmy krok, włączamy turbo. Klikamy przycisk, aby uruchomić komórkę, a Whisper zabiera się do pracy. Trochę cierpliwości i transkrypcja gotowa

.

Krok 8: Transkrypcja jest analizowana i sprawdzana

. [Ósmy i ostatni krok, szybkie spojrzenie na transkrypcję. Whisper jest profesjonalistą, ale nikt nie jest doskonały. Konieczne może być wprowadzenie kilku drobnych ręcznych poprawek

.

Szept, nasz codzienny przyjaciel

Whisper jest niepokojąco prosty. Nie musisz znać Pythona ani majstrować przy kodzie. Wystarczy wybrać, kliknąć i to wszystko. Otrzymasz transkrypcję, która jest dokładna jak szwajcarski zegarek, gotowa do pracy

. [Narzędzie o tysiącu obliczach [Whisper jest jak szwajcarski scyzoryk, ma wiele zastosowań. Chcesz transkrybować filmy z YouTube na różne języki, tłumaczyć treści audio, robić notatki na spotkaniach lub wykładach? Jest do Twojej dyspozycji. Whisper jest idealnym towarzyszem dla każdego, kto potrzebuje szybkich i dokładnych transkrypcji. A wszystko to podczas picia kawy. Czego chcieć więcej?

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *