Przedstawiamy Eleven v3 Alpha

Wypróbuj v3

Eleven v3 Audio Tags: Kierowanie występem postaci w mowie

Kontroluj ton, emocje i tempo dla naturalnej rozmowy. Dodaj występ postaci do zamiany tekstu na mowę.

v3

Audio Tags to potężne narzędzie w Eleven v3 (alpha), nowym modelu Text to Speech od ElevenLabs. Te elementy pozwalają precyzyjnie kierować nie tylko tonem i tempem, ale także charakterem i wykonaniem głosowym.

Dzięki tagom takim jak [głos pirata], [francuski akcent] czy [sarkastycznie], głos staje się narzędziem do opowiadania historii, a nie tylko narracji. Połącz to z mocnym klonem głosu postaci, a uchwycisz nie tylko dźwięk, ale pełne wykonanie.

Te tagi umożliwiają zmianę tożsamości głosowej w trakcie wypowiedzi, naśladowanie akcentów czy wcielanie się w archetypy jak złoczyńcy, narratorzy czy pomocnicy — bez zmiany scenariusza czy przełączania się na inny głos.

Czym jest wykonanie postaci w mowie AI?

Wykonanie postaci to umiejętność wcielenia się w rolę. Niezależnie czy wcielasz się w barwnego złoczyńcę, szorstkiego kapitana morskiego czy lokalnego sklepikarza z Melbourne, nowe Audio Tags pozwalają dostosować sposób wypowiedzi do postaci, którą chcesz przedstawić.

Prostą frazą w nawiasach możesz ustawić scenę: “[głos pirata] Arr, otwarte morze. Czujecie to, chłopcy? To zapach wolności… i odrobina buntu.”

Model nie tylko wymawia słowa — wykonuje je w charakterze.

Od akcentu do archetypu

Arr, the open ocean. Smell that, lads? That’s the scent of freedom… and just a hint of mutiny. (laughs wickedly) Now grab yer cutlasses, stow ya fear. Tonight, we dine like kings—or we sink like legends! (evil laugh)

Wykonanie głosowe to nie tylko głośność czy emocje. To także, kto mówi. Z Eleven v3 możesz na bieżąco wprowadzać konkretne akcenty, dialekty i style mówienia. Na przykład:

[amerykański akcent] Czy mogłeś zmienić mój akcent w starym modelu? [lekceważąco] Nie sądzę. [australijski akcent] Ale teraz możesz — zobacz to, kolego! [francuski akcent] Moja miłość… jest jak czerwona, czerwona róża.

Tego rodzaju płynne zmiany tożsamości są idealne do animacji, gier, interaktywnej fikcji czy wszędzie tam, gdzie osobowość mówcy ma znaczenie.

Popularne tagi do wykonania postaci

Tagi skupione na postaciach pozwalają kształtować tożsamość i obecność głosową:

  • Akcenty i dialekty: [brytyjski akcent], [australijski akcent], [południowy akcent USA]
  • Archetypy i role: [głos pirata], [głos złego naukowca], [dziecięcy ton]
  • Style mówienia: [dramatycznie], [sarkastycznie], [rzeczowo], [marudnie]
  • Wskazówki gatunkowe: [narrator fantasy], [głos AI sci-fi], [klasyczny film noir]

Łączenie tagów pomaga ożywić postacie: “[dramatycznie][francuski akcent] Nie rozumiesz... to nigdy nie chodziło o zemstę. Chodziło o przeznaczenie.”

Od narratora do zespołu postaci

W skryptach wielopostaciowych, Audio Tags ułatwiają przechodzenie między głosami. Dodaj napięcie, humor czy zaskoczenie, po prostu zmieniając wykonanie postaci w trakcie dialogu — bez dodatkowej edycji.

DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.

Weź ten fragment z dema: "Jessica: [śmiech] To było... piękne. Dr. Von Fusion: [dramatycznie] Być albo nie być — oto jest pytanie! Jessica: [francuski akcent] To jest spektakularne, prawda?"

To, co kiedyś wymagało pełnej obsady, teraz można zapisać w jednej ścieżce głosowej — bez utraty zasięgu czy głębi.

Reżyserowanie głosów, nie tylko pisanie linii

Eleven v3 wspiera dynamiczne zmiany głosowe, kontekstowe przesunięcia i spójne wykonanie w różnych postaciach. To oznacza, że model rozumie nie tylko co powiedzieć — ale jak każda postać powinna to powiedzieć.

Dla twórców to otwiera nowy wymiar kontroli. Nie tylko piszesz dialogi. Reżyserujesz wykonania.

Wybór odpowiedniego głosu

Profesjonalne Klony Głosowe (PVC) nie są jeszcze w pełni zoptymalizowane dla Eleven v3, co może skutkować niższą jakością klonów w porównaniu do wcześniejszych modeli. W tej fazie podglądu badawczego najlepiej znaleźć Instant Voice Clone (IVC) lub zaprojektowany głos do projektu, jeśli chcesz korzystać z funkcji v3. Optymalizacja PVC dla v3 jest wkrótce planowana.

Zobacz więcej

ElevenLabs

Twórz z najwyższą jakością dźwięku AI