Eva Szekely

CAPTivating: En jämförande analys av offentligt tal med talsyntes

Att fånga en publik betyder att locka och hålla lyssnarnas uppmärksamhet genom att vara intressant, spännande eller trevlig. Tack vare en kombination av ett paradigmskifte inom talsyntes (TTS), och våra egna framsteg är det nu möjligt att bygga en talsyntes på spontana taldata, vilket gör det möjligt att efterlikna en fängslande talares egenskaper. På Interspeech 2019 fick vårt papper "Off the Cuff: Exploring Extemporaneous Speech Delivery with TTS" priset för bästa demo. Den visade vad man kan göra med våra spontana TTS röster. Det är ett gränssnitt där man kan navigera olika versioner av talsyntes som läst upp transkriptionen av två symposietal. Syftet med det föreslagna projektet är att vidareutveckla verktyg och det för forskning inom språkvetenskap och talanalys, med fokus på att studera offentligt tal. Den föreslagna metoden syftar till att använda jämförande perceptuella experiment med spontan talsyntes för att systematiskt kunna variera aspekter av talproduktion och mäta deras direkta och kombinerade perceptuella inverkan på lyssnare. Vi kommer att kontrollera andning, röstkvalitet, prosody och tvekningar i vår TTS, för att studera deras effekt på lyssnarnas uppfattning av talaren, minne och kognitiva belastning mätt med multimodala sensorer. Slutligen avser vi att jämföra och kontrastera effekterna av dessa variationer i offentligt tal mellan svenska och engelska, och för att möjliggöra detta kommer vi att skapa det första talsyntesen byggd från svenskt spontant tal.
Bidragsförvaltare
KTH
Diarienummer
P20-0298
Summa
SEK 4 352 000
Stödform
RJ Projekt
Ämne
Språkstudier
År
2020