Facebook plaatste afgelopen week een zestal blogs over liefde gebaseerd op analyses van de profielen van hun gebruikers. In één van deze blogs (The Formation of Love) verklaart Facebook statistisch bewijs te hebben van ontluikende relaties nog voordat die relaties zijn begonnen.
Carlos Diuk, Facebook’s data analist, schrijft dat wanneer twee mensen een relatie beginnen dit vooraf wordt gegaan door een periode van een stijgend aantal berichten op elkaars tijdlijn. Nadat een stel hun relatie officieel maakt (op Facebook) daalt dit aantal berichten weer (waarschijnlijk omdat ze dan meer tijd met elkaar door brengen).
During the 100 days before the relationship starts, we observe a slow but steady increase in the number of timeline posts shared between the future couple. When the relationship starts (“day 0”), posts begin to decrease. We observe a peak of 1.67 posts per day 12 days before the relationship begins, and a lowest point of 1.53 posts per day 85 days into the relationship. Presumably, couples decide to spend more time together, courtship is off, and online interactions give way to more interactions in the physical world.
Het aantal berichten stijgt dus totdat de relatie officieel wordt gemaakt waarna het aantal berichten sterk daalt. Dit is gevisualiseerd in onderstaande grafiek:
Hoewel het aantal berichten daalt nadat de relatie is gestart worden de berichten díe geplaatst worden vrolijker, zoals te zien in de volgende grafiek:
Dit moet echter met een korreltje zout genomen worden. De Facebook berichten worden door algoritmes geanalyseerd. Dit betekent dat een bericht als positief of negatief wordt gemarkeerd op basis van sleutelwoorden. Zo’n algoritme kan echter niet tussen de regels door lezen waardoor sarcasme bijvoorbeeld over het hoofd gezien wordt.
We used statistical methods to automatically analyze a set of aggregated, anonymized timeline interactions. For each timeline interaction, we counted the proportion of words expressing positive emotions (like “love”, “nice”, “happy”, etc.) minus the proportion of words expressing negative ones (like “hate”, “hurt”, “bad”, etc.).
Facebook kan dus voorspellen wanneer je een relatie gaat krijgen. Wellicht dat adverteerders deze informatie zullen gaan gebruiken om jou advertenties op maat aan te kunnen bieden, bijvoorbeeld voor een romantische date. Dat dit echter helemaal mis kan gaan bewijzen de data analisten van Target.
Net als vele andere winkels verzamelt Target informatie over het koopgedrag van hun consumenten. Target’s data analisten hebben vervolgens geanalyseerd welke producten zwangere vrouwen aanschaffen om zo pas-zwangere vrouwen aan hun winkel te kunnen binden. Door het samenstellen van een lijst van vijfentwintig producten die vaak door zwangere vrouwen worden gekocht kan Target voorspellen wie zwanger is en zelfs wanneer iemand ongeveer gaat bevallen.
Target gebruikt deze informatie vervolgens om coupons te versturen naar klanten gebaseerd op hun zwangerschapsscores. Zo ook naar een jong meisje dat nog bij haar ouders woonde. Dit leverde een boze vader op die Target verweet jonge meisjes aan te moedigen om zwanger te raken. Het meisje bleek echter inderdaad zwanger te zijn. Een ongemakkelijk idee dat een bedrijf als Target nog eerder weet dat zo’n meisje zwanger is dan haar eigen ouders. Net zo ongemakkelijk als dat Facebook blijkbaar kan voorspellen wanneer iemand een relatie gaat krijgen.