Van HAL tot Her: Wat remt de opkomst van virtuele persoonlijke assistenten?

Wie regelmatig gebruik maakt van virtuele assistenten als Siri, Google Now of Cortana zal toegeven dat dit nauwelijks in de buurt komt van de klinkende dialogen tussen Joaquin Phoenix en zijn Samantha in ‘Her’. Wat maakt stembesturing nou zo lastig en komen we ooit van HAL tot Her?

Microsoft, Google en Apple. Het zijn niet de kleinste bedrijven die bezig zijn met het ontwikkelen van virtuele assistenten. Dat doen ze allemaal op hun eigen manier, maar ze delen één wens: de interactie met je virtuele assistent gaat via spraak, liefst zo natuurlijk mogelijk.

Zo ver zijn we overduidelijk nog niet en dus zijn Siri, Cortana en Google Now voor de gemiddelde consument bepaald nog geen PA. Het frustreert de bouwers zelf ook, zo bleek tijdens een sessie op SXSW, waar betrokkenen van Microsoft en Google hun ervaring deelde met het publiek én twee startups die stembesturing verder willen brengen.

Banaal

“Sommige redenen dat onze technologie nog niet is waar we het willen hebben zijn echt heel banaal”, stelt Lesley Carmichael, bij Microsoft betrokken bij Cortana. “We hebben te maken met de beperkingen van hardware, verschillende soorten microfoons om te luisteren, verschillende hardware om te berekenen.”

[tweetable fontsize=”105%” quote=”Sommige redenen dat onze technologie nog niet is waar we het willen hebben zijn echt heel banaal” author=””]Timothy Jordan, hoofd Development bij Google, knikt instemmend. “Verschillende platformen en hardware en zelfs soorten besturingssystemen. Althans, voor de aanwezigen in dit panel dan”, waarmee Jordan de afwezigheid van Apple in een sessie over virtuele assistenten aanstipt.

Maar zelfs als de hardware op de rit zou zijn, hebben ontwikkelaars te maken met uitdagingen ‘voorbij de microfoon’. “Het valideren van data blijft een aandachtspunt bij het Cortana-team,” deelt Carmichael, “Er moet nu nog veel gecontroleerd worden door mensen en dat is niet alleen duur, het kost ook gewoon meer tijd.”

Ver van startups

Jesse Robbins is oprichter van Orion, een bedrijf dat zich bezig houdt met het ontwikkelen van nieuwe concepten rond stembesturing en zogenaamde “Human-to-Computer Interaction”. Hij benadrukt dat er ontzettend veel kosten verbonden zijn aan de ontwikkeling van de technologie.

“Die enorme kosten zorgen er voor dat de ontwikkeling vooral in handen blijft van grote, rijke merken. Ver van startups die er mee aan de slag kunnen”, aldus Robbins. Doordat de grote partijen op hun dure eieren blijven zitten, komen creatieve ontwikkelaars minder makkelijk aan de technologie en dus raken de ontwikkelingen niet een stroomversnelling, stelt de ondernemer.

En zelfs als startups toegang krijgen tot de kennis en techniek van Google, Microsoft of Apple gelden er immense beperkingen. Of het nu gaat om de hardware of bepaalde protocollen, beperkingen van de mogelijkheden om te gebruiken of het gebruik van het merk in je app: de grote bedrijven willen hun investering wel terug zien.

“Bekend zijn de licenties die merken als Apple, Google en Nuance aanbieden om toegang te krijgen tot hun API’s. Je kunt er feitelijk niets mee zonder minimaal een kleine gezinsauto per maand te betalen aan licentiekosten”, stelt Robbins.

Toekomstige intelligentie

We staan volgens de panelleden duidelijk nog aan het begin van de ‘voice revolution’. Carmichael: “We staan aan de vooravond van de tienerjaren van de technologie. De puberjaren eigenlijk: we gaan ons af en toe heel ongemakkelijk voelen bij wat het ons brengt, maar zien door die ongemakkelijkheid iets moois ontstaan.”

“De intelligentie van de verschillende platformen is nu nog te beperkt”, denkt Robbins. De Amerikaan stelt dat de meeste persoonlijke assistenten die nu geroemd worden, nog veel programmering vooraf en contextuele begrenzingen nodig hebben. Zo moet je Alexa van Amazon via een aparte interface vertellen wie je bent en wat je Amazon-account is.

“Langzaamaan zien we nu diensten ontstaan die context onafhankelijk kunnen opereren. Ze hebben inzicht met wie ze praten en bepalen waar ze zijn”, vervolgt Robbins. Carmichael haakt aan: “Voor de Hololens van Microsoft een belangrijke ontwikkeling. Maar ook: wat moet er gebeuren met bepaalde gesproken informatie. Niet alles mag zomaar gedeeld worden via het netwerk of andere gebruiker.”

https://www.youtube.com/watch?v=WzV6mXIOVl4

De regels van kunstmatige intelligentie

Zelfs met die nieuwe, complexere intelligentie zijn we nog niet bij de dynamische dialogen die Samantha had met haar eigenaar in ‘Her’. “Daarvoor is ook wel heel veel zelflerend vermogen nodig,” aldus Carmichael, “algoritmes moeten dan leren hoe mensen reageerde op een uitspraak of actie. Het is echt een neuraal netwerk.”

Daarmee lijkt de geest uit de fles te komen. Zowel bij de andere panelleden als bij de luisteraars in de zaal zorgt de toevoeging van kunstmatige intelligentie in de mix tot gemengde reacties. De kritische houding van grote namen als Hawking en Musk tegenover de ontwikkelingen hebben duidelijk tractie gekregen.

[tweetable fontsize=”120%” quote=”We mogen niet vergeten hoeveel controle we zelf hebben over de inrichting van kunstmatige intelligentie” author=””]Terecht, stelt Carmichael, al moeten we niet vergeten dat we zelf een heleboel controle hebben over hoe die kunstmatige intelligentie wordt ingericht. “Het gaat om het helder krijgen van de definitie en context rond kunstmatige intelligentie. Kijk naar de recente overwinning van Google AlphaGo met een spelletje: de regels staan vast en de regels hoe die kunstmatige intelligentie mag leren ook”.

Met haar uitspraken onderstreept Carmichael de visie van Dennis Hassabis, die eind vorig jaar al benadrukte dat een open conversatie over kunstmatige intelligentie onvermijdelijk is. Diezelfde Hassabis is overigens ook weer betrokken bij Google’s AlphaGo project.

Carmichael: “Laten we vooral duidelijk maken dat de vorm van kunstmatige intelligentie die Hollywood ons voorschotelt op meerdere manieren ver van realistisch is.”