Siri op de Apple Watch.

Apple legt uit hoe Hé Siri alleen op jouw stem reageert

In een nieuwe uitgave van Apple's Machine Learning Journal leggen ze uit hoe Hé Siri persoonlijker wordt en alleen reageert op jouw commando. En waarom hebben ze eigenlijk gekozen voor de zin Hé Siri en niet voor een ander startcommando? Apple legt het zelf haarfijn uit.

Machine learning speelt bij Apple een steeds grotere rol. Je iPhone en iPad weten steeds meer van je en door een combinatie van kunstmatige intelligentie en algoritmes zijn er allerlei functies mogelijk. De portretfunctie maakt bijvoorbeeld gebruik van machine learning, maar ook voor Siri wordt deze techniek vaak gebruikt. In een eerder deel van het Machine Learning Journal gaf Apple al aan hoe Siri in iOS 11 steeds menselijker wordt. In het nieuwste deel wordt de Hé Siri-commando uitgelicht. Voor welke uitdagingen stond Apple en hoe kan Siri je stem herkennen?

Hey Siri uitgelegd in Machine Learning Journal
Om Siri te activeren zonder de homeknop in te hoeven drukken, gebruik je het Hé Siri-commando. Siri reageert vrijwel meteen en door je vraag aan de assistent te stellen geeft hij handsfree antwoord. Maar hoe kwam Apple op het idee om specifiek dit commando te gebruiken? Apple’s doel was om voor een zo natuurlijk mogelijk commando te kiezen. Zelfs voor de introductie van deze functie bleken gebruikers al Hé Siri te roepen na het indrukken van de thuisknop, dus deze uitspraak was snel gekozen. Voorheen was het nodig om de iPhone met het stopcontact te verbinden, maar sinds de iPhone 6s werkt het ook als je iPhone niet aan het opladen is.

Apple omschrijft in deze uitgave drie scenario’s waarin Siri onterecht geactiveerd wordt: bij het uitspreken van een soortgelijke zin door de eigenaar van de iPhone of iPad, bij het uitspreken van Hé Siri door iemand anders of door het uitspreken van een soortgelijke zin door iemand anders. Het laatste scenario is volgens Apple het meest vervelend, omdat Siri niet alleen per ongeluk geactiveerd wordt, maar ook nog eens door een uitspraak van iemand anders. Dit zorgt er dus voor dat iedereen verrast wordt door het plotselinge spreken van Siri. Om deze foutmarge zo laag mogelijk te houden, gebruikt Apple ‘speaker recognition’ (SR).

Met speaker recognition bedoelt Apple dus het herkennen van de spreker, in plaats van het herkennen van een zin zoals bij spraakherkenning het geval is. Apple is dan ook vooral geïnteresseerd in wie er praat en niet zozeer in wat er gezegd wordt. Om het activeren van Siri te verbeteren, meet Apple allerlei valse commando’s. Vervolgens gaat het verslag uitgebreid in op de uitdagingen die hier voor Apple liggen. Een belangrijk deel van het goed herkennen van je stem is het moment dat je Hé Siri voor het eerst instelt. Je moet dan namelijk meerdere keren de zin uitspreken, gevolgd door een tweetal opdrachten.

Ook het gebruik van de functie moet het herkennen van je stem steeds beter maken, mede dankzij machine learning. Om de herkenning van de gebruiker nog verder te verbeteren, kan Apple ook nog gebruikmaken van de vraag die je stelt ná de Hé Siri-commando. Sinds iOS 11 is het beter om na het roepen van Siri meteen je vraag te stellen, in plaats van af te wachten totdat Siri je hoort.

Lastig bij grote kamers en veel geluid
Apple geeft zelf aan dat de herkenning van een gebruiker bij Hé Siri de laatste jaren flink verbeterd is, maar dat grote kamers en een luidruchtige omgeving nog steeds roet in het eten kunnen gooien. Om dit te verbeteren is volgens Apple nog verdere training nodig. Apple zegt al succes te boeken met allerlei extra tests.

Dit nieuwste deel van de Machine Learning Journal geeft een uniek kijkje in het ingewikkelde proces dat bij zo’n functie als Hé Siri komt kijken. De gehele uitgave omtrent dit onderwerp kun je lezen op Apple’s pagina over machine learning.

Suggestie hoe we dit artikel kunnen verbeteren? Laat het ons weten!

Informatie

Laatst bijgewerkt 16 april 2018, 20:00
Bron Bron Machine Learning Journal
Categorieën Achtergrond, Apple
Onderwerpen kunstmatige intelligentie, siri

Reacties zijn gesloten voor dit artikel.