Piotr Dąbkowski i Mateusz Staniszewski, założyciele ElevenLabs. Mati Staniszewski (po prawej) trafił na okładkę Forbesa.
Mati Staniszewski (po prawej) trafił na okładkę Forbesa. 30-letni Polak staje się gwiazdą biznesu AI. Na zdjęciu obok niego Piotr Dąbkowski, współzałożyciel ElevenLabs. mat. pras.

"Mały polski startup stał się wielomiliardowym głosem sztucznej inteligencji" – pisze amerykański "Forbes", który na okładkę wrzucił wizerunek Mateusza Staniszewskiego, kierującego firmą ElevenLabs. "Głosy komputerowe ElevenLabs są tak przekonujące, że mogłyby oszukać twoją matkę" – dodaje.

REKLAMA

Autor tekstu o Polaku, który stał się jednym z liderów globalnego wyścigu AI w swojej branży, dodaje, że "to zarówno błogosławieństwo – założyciele programu 30 Under 30, są teraz miliarderami – jak i przekleństwo dla czteroletniej firmy".

ElevenLabs to startup, który oferuje zamianę tekstu na dźwięk dzięki naturalnie brzmiącym syntezatorom mowy. Założycielami przedsiębiorstwa są Mati Staniszewski i Piotr Dąbkowski.

ElevenLabs osiągnęło status jednego z najbardziej rozpoznawalnych startupów AI na świecie. Swoją działalność zaczęli w 2022 roku, a status "jednorożca" (wyceny rynkowej na 1 mld dolarów) uzyskali w ledwo dwa lata. Wśród użytkowników ich produktu są przedstawiciele branży kreatywnej i mediów, w tym giganci jak "The Washington Post" czy "The New Yorker".

Jak powstał ElevenLabs? Staniszewski nie lubił filmów czytanych przez lektora

Staniszewski opowiada "Forbesowi", że inspiracją dla założenia firmy stały się dla niego oglądane w Polsce filmy z lektorem. Nie lubi tego rozwiązania. "Zapytaj dowolnego Polaka, a powie ci, że to okropne. Był to chyba komunistyczny fenomen, który przyjął się jako tani sposób na produkcję treści" – mówi przedsiębiorca.

Pracując w Palantir, Staniszewski nawiązał współpracę z Piotrem Dąbkowskim, kolegą z liceum i inżynierem Google, aby eksperymentować ze sztuczną inteligencją. W 2022 roku zainwestowali oszczędności we własną firmę. Ich nowy generator tekstu na mowę oparty na sztucznej inteligencji okazał bardziej niezawodny niż głosy Siri od Apple'a i Alexy od Amazona. Głosy sztucznej inteligencji ElevenLabs potrafiły imitować radość, ekscytację, a nawet śmiech.

W styczniu 2023 roku ElevenLabs wprowadziło na rynek swój pierwszy model. Po rozwiązanie sięgnęli twórcy audiobooków, filmów, podkastów, firmy oferujące kursy językowe. Modele ElevenLabs potrafią teraz mówić w 29 językach.

ElevenLabs zbiera nie tylko pochwały. Są i kontrowersje

To stało się też przyczyną kłopotów. Po ich rozwiązanie sięgnęli też mniej odpowiedzialni użytkownicy i cyberprzestępcy. Emma Watson "czytająca" Mein Kampf czy podcaster Joe Rogan "reklamujący" oszustwa, szybko stali się viralem. Po cudze głosy sięgnęli też oszuści, podszywający się pod bliskich ofiar i tworzący skomplikowane złodziejskie deepfake.

Nie powstrzymało to inwestorów, którzy włożyli w ElevenLabs łącznie ponad 300 milionów dolarów. Firma osiągnęła w październiku wycenę 6,6 miliarda dolarów i stała się jednym z najcenniejszych startupów w Europie. Staniszewski i Dąbkowski mają po około miliardzie dolarów, a firma jest rentowna. "Forbes" szacuje, że w ciągu ostatnich 12 miesięcy ElevenLabs osiągnęło zysk w wysokości 116 milionów dolarów (marża na poziomie 60 proc.).

Dziś dla ElevenLabs pracuje 300 osób. Firma ma bibliotekę 10 000 sztucznych głosów, których algorytmy są niezwykle dokładne i biją konkurencję na głowę. ElevenLabs przeszło też kryzys, kiedy pozew przeciwko niemu złożyła para lektorów audiobooków. Karissa Vacker i Mark Boyett twierdzili, że ElevenLabs wykorzystało tysiące audiobooków chronionych prawem autorskim do trenowania swoich modeli. W efekcie to klony ich głosów stały się domyślnymi opcjami w ElevenLabs. Sprawa została rozstrzygnięta "poza sądem".

Firma w końcu sporządziła listę głosów "zakazanych" (głównie polityków i celebrytów). Stało się to po tym, jak stworzony przez ElevenLabs klon głosu Joe Bidena został wykorzystany do zniechęcania Amerykanów do głosowania w wyborach prezydenckich w 2024 roku.

ElevenLabs zatrudnia teraz siedmiu pełnoetatowych moderatorów oraz sztuczną inteligencję, którzy razem przeszukują nagrania pod kątem nadużyć. Nowo sklonowane głosy muszą przejść kontrolę, a firma oferuje darmowy wykrywacz deepfake. Otworzyła też licencjonowaną bibliotekę głosów znanych osób.