
Eleven v3 Audio Tags: Enabling narrative intelligence in speech
Guide emotional rhythm and structural flow with tags like [pause], [awe], or [dramatic tone] for compelling storytelling.
Przedstawiamy Eleven v3 Alpha
Wypróbuj v3Kontroluj ton, emocje i tempo dla naturalnej rozmowy. Dodaj występ postaci do zamiany tekstu na mowę.
Audio Tags to potężne narzędzie w Eleven v3 (alpha), nowym modelu Text to Speech od ElevenLabs. Te elementy pozwalają precyzyjnie kierować nie tylko tonem i tempem, ale także charakterem i wykonaniem głosowym.
Dzięki tagom takim jak [głos pirata], [francuski akcent] czy [sarkastycznie], głos staje się narzędziem do opowiadania historii, a nie tylko narracji. Połącz to z mocnym klonem głosu postaci, a uchwycisz nie tylko dźwięk, ale pełne wykonanie.
Te tagi umożliwiają zmianę tożsamości głosowej w trakcie wypowiedzi, naśladowanie akcentów czy wcielanie się w archetypy jak złoczyńcy, narratorzy czy pomocnicy — bez zmiany scenariusza czy przełączania się na inny głos.
Wykonanie postaci to umiejętność wcielenia się w rolę. Niezależnie czy wcielasz się w barwnego złoczyńcę, szorstkiego kapitana morskiego czy lokalnego sklepikarza z Melbourne, nowe Audio Tags pozwalają dostosować sposób wypowiedzi do postaci, którą chcesz przedstawić.
Prostą frazą w nawiasach możesz ustawić scenę: “[głos pirata] Arr, otwarte morze. Czujecie to, chłopcy? To zapach wolności… i odrobina buntu.”
Model nie tylko wymawia słowa — wykonuje je w charakterze.
Wykonanie głosowe to nie tylko głośność czy emocje. To także, kto mówi. Z Eleven v3 możesz na bieżąco wprowadzać konkretne akcenty, dialekty i style mówienia. Na przykład:
[amerykański akcent] Czy mogłeś zmienić mój akcent w starym modelu? [lekceważąco] Nie sądzę. [australijski akcent] Ale teraz możesz — zobacz to, kolego! [francuski akcent] Moja miłość… jest jak czerwona, czerwona róża.
Tego rodzaju płynne zmiany tożsamości są idealne do animacji, gier, interaktywnej fikcji czy wszędzie tam, gdzie osobowość mówcy ma znaczenie.
Tagi skupione na postaciach pozwalają kształtować tożsamość i obecność głosową:
Łączenie tagów pomaga ożywić postacie: “[dramatycznie][francuski akcent] Nie rozumiesz... to nigdy nie chodziło o zemstę. Chodziło o przeznaczenie.”
W skryptach wielopostaciowych, Audio Tags ułatwiają przechodzenie między głosami. Dodaj napięcie, humor czy zaskoczenie, po prostu zmieniając wykonanie postaci w trakcie dialogu — bez dodatkowej edycji.
Weź ten fragment z dema: "Jessica: [śmiech] To było... piękne. Dr. Von Fusion: [dramatycznie] Być albo nie być — oto jest pytanie! Jessica: [francuski akcent] To jest spektakularne, prawda?"
To, co kiedyś wymagało pełnej obsady, teraz można zapisać w jednej ścieżce głosowej — bez utraty zasięgu czy głębi.
Eleven v3 wspiera dynamiczne zmiany głosowe, kontekstowe przesunięcia i spójne wykonanie w różnych postaciach. To oznacza, że model rozumie nie tylko co powiedzieć — ale jak każda postać powinna to powiedzieć.
Dla twórców to otwiera nowy wymiar kontroli. Nie tylko piszesz dialogi. Reżyserujesz wykonania.
Profesjonalne Klony Głosowe (PVC) nie są jeszcze w pełni zoptymalizowane dla Eleven v3, co może skutkować niższą jakością klonów w porównaniu do wcześniejszych modeli. W tej fazie podglądu badawczego najlepiej znaleźć Instant Voice Clone (IVC) lub zaprojektowany głos do projektu, jeśli chcesz korzystać z funkcji v3. Optymalizacja PVC dla v3 jest wkrótce planowana.
Guide emotional rhythm and structural flow with tags like [pause], [awe], or [dramatic tone] for compelling storytelling.
Infuse AI speech with emotional nuance using Eleven v3 Audio Tags. Control tension, warmth, hesitation, and relief for relatable, dynamic, and human-like spoken content.
Napędzane przez ElevenLabs Conversational AI