Proeftentamen spraakherkenning en synthese, deel B 4a) - P(Observation|Words) is de kans dat Words aanleiding geeft tot de realisatie als Observation - P(Words) is de kans op het voorkomen van Words volgens een a priori taalmodel, mbv. unigram, bigram etc. modellen. - P(Observation) staat voor de kans op de waarneming, die genegeerd kan worden (sic). b) De transities van een finite-state model hangen niet af van vorige of komende states, slechts van de huidige state. Een N-gram model daarintegen maakt de N-1 voorgaande states bepalend (voorwaarden) voor de volgende state. Taalmodellen woorden gebruikt in ASR om onvolledige en onduidelijke data te kunnen interpreteren. Het niet verstaan van een enkele woord kan zo worden opgevangen door de andere woorden in de zin te bekeken en het meest waarschijnlijke woord gegeven de anderen aan te nemen. Deze taalmodellen kunnen automatisch getraind worden door zoveel mogelijk invoer te presenteren. Hierdoor wordt het model statistisch gezien steeds sterker. c) Aanvankelijk wordt de input gegeven aan een algemene, snelle decoder. Deze komt vervolgens met de N beste resultaten (waarbij N een parameter is de gewenste hoeveelheid weergeeft). Deze resultaten worden doorgegeven aan de tweede /pass/ die langzamer maar slimmer is. Zo kan een select aantal alternatieven goed bekeken worden. Een extra mogelijkheid is dat de tweede trap gebruik maakt van een geheel andere technologie dan de eerste (statistisch model). Er kan worden gedacht aan het letten op discourse elementen (zeldzaam woord "yeti" is al eerder genoemd dus maakt toch een goede kans). d) Om het model te trainen op realistisch achtergrond geluid. Dit moet namelijk kunnen worden weggefilterd. Ze kunnen zodoende het beste trainen op een drukke weg. e) Formant analyse (?) 5a) - quantity: hou het zo kort mogelijk - quality: wees zo feitelijk mogelijk - relevance: dwaal niet af - manner: wees duidelijk b) Men liet proefpersonen het systeem gebruiken. Later werd mens gevraagd of ze opgenomen mochten worden, toen het systeem al in gebruik was. c) Adjacency pairs zijn vaste formules zoals vraag-antwoord en begroetingen. Deze kunnen gebruikt worden in een dialoogsysteem om het gesprek te sturen, nadat een vraag gesteld is weet de computer dat er een antwoord op hoort te volgen.