Mozilla ‘s” Felles Stemme ” – et Crowdsourced Database For Talegjenkjenning Forbedring

0
114

Jeg får masse komplimenter om min dype Skotsk aksent, men når det kommer til tale-programmer som Siri og Alexa, min stemme er en belastning mer enn en ressurs. Når Apple og Amazon var å gjøre sin stemme assistenter, synes de ikke å ha en Skotsk aksent konsulent på speed-dial.

Hvis talegjenkjenningen er ment å være slik i fremtiden – og angivelig det er der vi er ment til å være på vei – så søkemotorer og stemme assistenter trenger for å begynne å gjøre en bedre jobb med å forstå vanskelige aksenter. Vi trenger ikke alle har offentlig engelsk skolegutt aksenter.

Mozilla (skaperne av nettleseren Firefox) er forsøk på å prøve å løse problemet ved å spørre folk til å jobbe frivillig med sine stemmer til en database kalt “Felles Stemme”. Ved å gi stemmer til uttrykk, Mozilla håper at deres database til slutt vil bli et uvurderlig verktøy i fremtiden til en hvilken som helst app avhengig av talegjenkjenning.

Påmelding Til ‘Felles Stemme’

Før vi går videre, la oss få problemer med personvern ut av veien først, så jeg kan allerede høre dem komme inn.

Mens det er mulig for deg å registrere deg som bruker Firefox-konto, Github-konto, eller Google-kontoen din, kan du i stedet logge deg på via e-post. Bare åpne en anonym bruk-og-kast-e-post-konto og ingen vil bli noe klokere det er du som snakker.

Når du har laget en konto og logget inn, vil du se oversikten.

Det er to deler – Snakke og Lytte. De Snakker delen hvor du blir bedt om å bidra med din egen stemme. Lytte er der du lytte til andres stemmer og sammenligne dem til uttrykket de hadde å si. Du vil deretter avgjøre om det var riktig.

Snakke

For å ta del i den muntlige delen, vil du trenger en fungerende mikrofon som vil plukke opp stemmen din, helt klart. Du må også gi Mozilla nettstedet tilgang til mikrofon.

Når du klikker på Tale – delen, vil du bli gitt et sett av fem tilfeldige setninger for å snakke. Instruksjonene er veldig tydelig på skjermen og lett å følge.

Du kan ganske enkelt klikke på mikrofon-ikonet under, og deretter lese den setningen i normal tone. Ikke satt på en unaturlig aksent eller snakker veldig sakte.

Hele poenget med øvelsen er at databasen lærer å forstå folks aksenter på den måten de er vanligvis muntlig. Snakke på en annen måte gjør bare det hele meningsløst.

Når den første setningen har blitt gjort, vil du se øverst i høyre hjørne kan velge å enten spille av klippet og å re-registrere klippet hvis du ikke er fornøyd med det.

Hvis du er fornøyd med det, flytter til den neste, og fortsetter til alle fem setninger er gjort. Deretter klikke på den blå knappen Send for å sende klipp til Mozilla for å sjekke.

Hvis du nå går tilbake til oversikten, vil du se at du har blitt kreditert for de setningene.

Så det er en enkel sak av skyll og gjenta. Jo flere bidrag og ulike aksenter Mozilla kan få i sin database, jo mer vellykket prosjekt.

Lytt

Når folk har sendt inn sine setninger for å Mozilla, de trenger å bli sjekket for å sikre at lydklipp samsvarer med uttrykket. Dette er noe som også blir crowdsourced ut til frivillige.

Tilbake i oversikten, vil du se Lytte – delen på høyre side. Du kan se fra Toppen Bidragsytere delen som noen alvorlige statistikk har vært plaget opp.

For å starte validering stemme setninger, kan du gå til Lytte – delen, og du vil bli gitt en setning og en play-knappen.

Klikk på play-knappen (kontroller at høyttalerne er på!) og du vil høre på innspilt stemme. Hvis du bestemmer deg for uttrykket ble talt riktig, klikker du på Ja. Hvis det var mispronunciation, noe annet er sagt, eller andre feil, klikker du INGEN.

Konklusjon

Dette er bare ett av mange prosjekter som Mozilla har tenkt på i det øyeblikket (gå til de viktigste Mozilla nettstedet ditt, og klikk Prosjekter på toppen – det forandrer seg hele tiden). Crowdsourcing er en flott måte for verdige prosjekter til å skje, og det er alltid verdt å donere din tid til å hjelpe til med å bygge noe nyttig for fremtiden.