Siri-iPad-Pro

Zo zorgt Apple ervoor dat Siri nieuwe talen leert

Hoe leert Siri eigenlijk nieuwe talen? Van het inspreken van de eerste woorden tot het opnemen van de stemacteur: het proces van het leren van een taal vergt behoorlijk wat inspanning.

Siri is één van de weinige slimme assistenten die in een grote hoeveelheid talen beschikbaar is. Siri kent maar liefst twintig talen met daarnaast ook nog allemaal aparte versies voor verschillende dialecten. Zo spreekt en begrijpt Siri maar liefst negen verschillende soorten Engels, van Amerikaans tot Indiaas. Maar hoe leert Siri nieuwe talen precies? Reuters sprak met Alex Acero, het hoofd van Apple’s spraakteam.

Siri-iPad-Pro

Eerste stap voor Siri: dicteren

Alex Acero is bij Apple verantwoordelijk voor alles wat met spraak te maken heeft. Dat geldt niet alleen voor Siri, maar bijvoorbeeld ook voor de dicteeroptie en de Voice-Over-functie, waardoor je toestel tekst op het scherm kan uitspreken. Het leren van een nieuwe taal voor Siri begint dan ook bij de basis. Zodra Apple besluit om een nieuwe taal aan Siri toe te voegen, worden er mensen van de desbetreffende taal uitgenodigd die passages oplezen in allerlei accenten en dialecten. Dit wordt vervolgens met de hand omgezet zodat de computer een goede indruk krijgt van de gesproken tekst. Apple neemt ook allerlei geluiden van verschillende stemmen op, waarna er een taalmodel gemaakt wordt. Dit model kan vervolgens woordreeksen voorspellen, zodat de taal begrepen kan worden.

Dat is echter lang niet genoeg voor Siri om de nieuwe taal helemaal goed te begrijpen. Om meer gegevens te verzamelen, zet Apple de tot dan toe verzamelde data in voor de dicteer-modus. De dicteer-modus zorgt ervoor dat tekst die jij inspreekt, omgezet wordt in getypte tekst. De dicteer-modus hoeft nog niks terug te zetten, maar luistert alleen. Als gebruikers de dicteer-modus gebruiken, verzamelt Apple een deel van deze opnames anoniem. Deze gegevens worden vervolgens door mensen omgezet tot bruikbare data, zelfs inclusief achtergrondgeluiden. De foutmarge wordt op deze manier ook gehalveerd, zo legt Alex Acero uit. Het voordeel van deze methode is dat Apple op deze manier een hoop dialecten en accenten anoniem kan verzamelen. Voor de Nederlandse Siri is vermoedelijk dezelfde methode gebruikt. Voordat Siri in het Nederlands beschikbaar kwam, werd eerst de dicteren-stand al beschikbaar gesteld.

Stemacteur voor opnames van Siri

Zodra er genoeg gegevens verzameld zijn, huurt Apple een stemacteur in die de Siri-antwoorden opneemt. De acteurs die Siri vertolken zijn vaak wat geheimzinnig, maar in Nederland gaat dit vermoedelijk om Floris van den Broek. Na deze opnames wordt Siri in een nieuwe taal beschikbaar gesteld met een software-update van iOS. In het begin geeft Siri vooral antwoorden op de meest gestelde vragen, maar naarmate het meer gebruikt wordt, leert Siri ook meer over de gestelde vragen. Acero zegt dat Siri elke twee weken bijgewerkt wordt met tweaks en nieuwe gegevens.

Antwoorden van assistenten zoals Siri worden momenteel nog geschreven door scriptschrijvers. Uiteindelijk zou kunstmatige intelligentie dit moeten vervangen, maar zover lijkt het voorlopig nog niet te zijn. Het leren van een nieuwe taal is dus een langlopend proces dat Apple de afgelopen jaren al veelvuldig gebruikt heeft. Ten opzichte van andere slimme assistenten kent Siri veel meer talen. Cortana van Microsoft kent bijvoorbeeld maar acht talen voor dertien landen, terwijl Google Assistant niet verder komt dan vier talen. De nieuwste toevoeging van Siri is Shanghainese, een dialect van Wu Chinese dat vooral bij Shanghai veel gesproken wordt. Deze nieuwste taal wordt toegevoegd met de komst van iOS 10.3.

Suggestie hoe we dit artikel kunnen verbeteren? Laat het ons weten!

Informatie

Laatst bijgewerkt 9 maart 2017, 13:21
Categorieën Apple, Diensten
Onderwerp siri

Reacties zijn gesloten voor dit artikel.