Talesyntese, syntetisk tale eller kunstig tale er et tekst til tale system. Tekst som vises på en dataskjerm kan ved hjelp av et skjermleserprogram og en enhet for syntetisk tale bli opplest med en kunstig stemme. Det finnes eldre systemer som gjør dette helt syntetisk mens nyere systemer bruker lyder generert av en naturlig menneskelig stemme. Teknologien kan tas i bruk for mennesker med lesevansker som dysleksi eller for synshemmede.
Ulike metoder for talesyntese
Talesynteseprogram har lenge brukt den såkalte difonmodellen, i de siste årene[når?] har man også brukt Hidden Markov Models, eller HMM. Tidligere anvendte man en fullstendig syntetisk tale, der fonemene (lydenhetene) ble produsert ved å kombinere formantane for hver lyd. Problemet med den syntetiske innfallsvinkelen er at resultatet blir syntetisk, en stemme med «robotklang». De fonetiske egenskapene til menneskelig tale er langt mer komplisert, og består ikke bare av de kjente fonemene. I difonbaserte systemer tas med overgangene mellom de enkelte fonemene. Disse stemmene høres mye mer naturlig ut enn kun fonembaserte systemer.
Det motsette av talesyntese er talegjenkjenning, et dataprogram som er i stand til å overføre tale til tekst.
Applikasjoner
Per dags dato finnes det mange ulike norske talesynteser, både kvinne- og mannsstemmer. I begynnelsen av 2012 kommer den første barnestemmen på markedet [1].
Norske syntetiske stemmer
- Acapela Bente[2]
- Acapela Elias[3]
- Acapela Emilie[4]
- Acapela Kari[5]
- Acapela Olav[6]
- Acapela Thomas[6]
- IVONA Liv
- LingSpeak Arne[7]
- Lingit Isak (SAPI-kompatibel, bokmål/nynorsk)[8]
- Lingit Inger (SAPI-kompatibel, bokmål/nynorsk)[9]
- NLB Brage[10]
- Nuance Stine[11]
- Loquendo Henrik[12]
- Loquendo Vilde[13]
- eSpeak (under arbeid)[når?][14]
MediaLT har en test av norske talesynteser med lydeksempler.[15]
MS Windows
I MS Windows brukes vanligvis SAPI-baserte stemmer. SAPI (Speech Application Programming Interface) er et standardisert talegrensesnitt mellom for eksempel syntetisk taleenhet og en applikasjon som støtter taleteknologi. På denne måten kan man bruke en syntetisk stemme til ulike Windows applikasjoner framfor å kjøpe et system til hver applikasjon.
Mac OS
Mac OS har også innebygd talesyntese som standard. Applikasjonene kan benytte seg av denne tilgjenglighetsfunksjonen.
iOS
iOS støtter også talesyntese ved hjelp av den innebygde skjermleseren VoiceOver.
Referanser
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.