Google's Project Euphonia: wat het is en hoe het mensen met atypische spraak kan helpen - BeoordelingenExpert.net

Inhoudsopgave:

Anonim

De meeste mensen associëren de Americans with Disabilities Act met fysieke, infrastructurele wijzigingen die moeten worden aangebracht aan gebouwen of andere locaties, maar naarmate de definitie van handicap breder wordt, realiseren mensen zich dat 'toegankelijk' ook geldt voor zaken als websites en spraakherkenning.

In dit geval spant technologiegigant Google zich in om zijn spraakherkenningssoftware te verbeteren met Project Euphonia. Project Euphonia is een initiatief om stemmonsters van vrijwilligers op te nemen en te analyseren zodat mensen met ALS, neurologische aandoeningen en andere spraakproblemen hun slimme apparaten kunnen gebruiken met het gemak van een 'typisch' individu.

Waarom ik vrijwilligerswerk deed?

Een verlamde linker stemband en asymmetrische tong door een hersentumor heeft geresulteerd in mijn spraakaandoening Dysartrie. Mijn onduidelijke spraak en zwakke stem maken het moeilijk voor vrienden en familie om me te verstaan ​​of te horen, vooral in een drukke ruimte. Dit maakte me een uitstekende kandidaat voor Project Euphonia, dus ik meldde me aan zodra ik erover las. Ik nam samples op op een rudimentaire website en herhaalde 4.500 zinnen van 'Hoe kom ik in Mountain View, Californië?' tot 'Speel nummers van Cardi B'.

Behalve dat ik voldeed aan de criteria van Project Euphonia, bood ik me vrijwillig aan omdat ik in 1997 voor het eerst kennismaakte met het vooraanstaande spraakherkenningsprogramma Dragon Naturally Speaking - en het faalde spectaculair. In de loop der jaren heb ik analoge programma's geprobeerd in het Assistive Technology Lab in het Boston's Children's Hospital, evenals bijgewerkte versies van Draak, en hoewel deze software grote vooruitgang heeft geboekt, worstelt het nog steeds om mijn stem te lokaliseren.

Dit is om twee redenen problematisch: ik ben een schrijver met een gebrek aan fijne motoriek, dus typ ik met één hand, of langzaam met twee als ik moe ben. Met drie in eigen beheer uitgegeven gedichtenbundels, een memoires en een verzameling niet-gepubliceerde gekoppelde verhalen op mijn naam, huiver ik bij de gedachte hoeveel meer ik had kunnen produceren als typen niet zo'n fysiek zware taak was.

De andere reden waarom ondermaatse spraakherkenning een barrière voor mij vormt, is vanwege de toename van spraakgestuurde producten in huizen en op telefoons. Alleen al door mijn verhaal te gebruiken, als ik toegang zou krijgen tot computers en slimme apparaten zoals ze bedoeld waren, zou het me meer vrije tijd geven, me in staat stellen om taken volledig uit te voeren en mogelijk de manier waarop ik leef te transformeren.

Project Euphonia: hoe werkt het?

Dus, hoe werkt Euphonia? Nadat ik een prototype-app met een gepersonaliseerd spraakherkenningsmodel naar mijn telefoon had gedownload, plaatste ik de telefoon naast mijn laptop en dicteerde erin; terwijl ik dit deed, zag ik alles wat ik zei in mijn Google-document op mijn laptop verschijnen. Ik deed dit een paar maanden, nam zinnen op uit een roman die ik aan het schrijven was en corrigeerde eventuele onnauwkeurigheden voor Google met behulp van de app.

Na nog een aantal maanden zonder zinnen op te nemen, voltooide ik de eerste versie van een roman - 20.000 woorden - met behulp van de app. Dit wil niet zeggen dat het foutloos is; voor elk uur dat ik schrijf, moet ik teruggaan en een uur besteden aan het aanbrengen van kleine correcties. Maar ik vind het niet erg omdat Euphonia zich in een bètafase bevindt en in plaats van traag 100 woorden per dag uit te spreken, genereer ik 500 woorden per dag.

Dan is er het feit dat Euphonia niet is ontworpen voor tekstverwerking - het is meer voor declaratieve commando's - en mijn schrijfstijl is wat ze een 'pantser' noemen (vlieg langs de zetel van je broek), dus ik heb veel pauzes omdat ik niet weet hoe een zin zal eindigen - je weet wel, zoals Michael Scott. Als ik echter weet wat ik wil zeggen, zoals in sms'jes, e-mails of het geven van instructies aan mijn assistent, is dit verreweg de meest nauwkeurige spraakherkenning die ik ooit heb gebruikt.

Wanneer instellingen als Google een stem geven aan gehandicapten bij het ontwerpen van de architectuur van de toekomst, door ze zichzelf te laten blijven in plaats van te proberen ze om te zetten in iets 'normaals', geeft me dat hoop dat in het tijdperk van AI het humanisme zal zegevieren.

Als je de Project Euphonia-website wilt bezoeken, of een spraakstoornis hebt en een stemvoorbeeld wilt bijdragen, kun je naar deze link gaan: https://sites.research.google/euphonia/about/