Toujours interressant de creuser les données brutes qui envahissent notre monde.
Ici celles que Google divulge chaque semestre depuis 2009 et concernant les demandes d'information sur des internautes, en particulier en provenance des gouvernements.
Ne nous leurrons pas : il n'y a pas que les gouvernements qui nous surveillent ... Mon propos vise ici le traitement des données, avec un objectif d'information / connaissances. Mais d'une pierre deux coups : autant diffuser aussi des informations utiles à notre culture numérique.
Données brutes fournies par Google
Un tableau simple, par semestre (ici entre Janvier et Juin 2014)
- le nombre de demandes de renseignements sur les utilisateurs émanant d'administrations et de tribunaux ;
- le nombre de demandes ayant fait l'objet d'une réponse (partielle ou complète) de la part de Google;
- (% des demandes ayant fait l'objet d'une réponse > colonne rajoutée)
- Utilisateurs/Comptes spécifiés soit le nombre total d'utilisateurs ayant fait l'objet d'une demande de renseignements de la part d'une administration
Janv-Juin 2014 | Nb de Demandes renseignements... | Nb de demandes ayant conduit à une réponse | % de demandes ayant conduit à une réponse | Utilisateurs/ Comptes concernés |
TOTAL | 31698 | 20603 | 65% | 48615 |
USA | 12539 | 10533 | 84% | 21576 |
DE | 3338 | 1602 | 48% | 4272 |
FR | 3002 | 1741 | 58% | 3826 |
UK | 1535 | 1105 | 72% | 1991 |
Les citoyens de chaque pays peuvent regarder les trois données fournies, et demander des comptes à leurs gouvernants, s'interroger...
On peut aussi chercher à faire des comparaisons. Et là les journaux (français que j'ai lu...) vous annoncent que les USA sont les grands gagnants et donc les grands méchants. Cela évite de regarder par chez nous ... 300 millions d'habitants d'un côté (USA) et 61 de l'autre (FR). Un traitement s'impose.
(Petite) analyse
Voyons ce que permet le traitement de données pour gagner en connaissances sur cette action des autorités administratives.
Un premier traitement simple : une représentation visuelle des données brutes
Ce traitement cosmétique a comme principale intérêt ... de nous faciliter le questionnement :
- Pourquoi une telle différence entre les pays ?
- Pourquoi une telle différence entre le nombre des demandes et des réponses
Différences entre pays
S'il visualise les différences entre pays, le précédent graphique ne les explique donc pas !
Une vision comparative des pratiques oblige à intégrer les différences de population entre pays dans les calculs. Ramener ce chiffre au nombre de demandes pour 100 000 Habitants offre une autre vision des pratiques des (gouvenements ou tribunaux) de ces pays.
Deux constats :
- En dehors du Royaume-Uni, ces chiffres sont assez proches
- Mais la France est tout de même en tête du nombre de demandes d'information pour 100 000 habitants !
Ces différences sont elles significatives ? Qu'en déduire ? Je n'ai pas d'explication ni de justification à ce stade, mais je reste très intriguée...
Différences entre le nombre des demandes et des réponses
Le pourcentage de réponses partielles ou complètes apportées par Google aux demandes formulées, interroge. Ainsi le chiffre pour l'Allemagne puis pour la France est assez bas, comparativement aux USA et surtout au Royaume-Uni.
Il nous a semblé plus intéressant de mettre en avant les demandes "rejetées", c'est-à-dire pour lesquelles Google n'a pas apporté de réponse.
Ce dernier tableau montre un nombre de rejets de la part de Google important pour l'Allemagne (52%) et la France (42%), comparativement au Royaume-Unis (28%) ou aux USA (16%).
Les raisons évoquées tournent autour de demandes "abusives, pas ou mal fondées" !
Différences entre le nombre de demandes et d'utilisateurs/comptes
Le dernier chiffre diffusé par Google montre des différences (importantes) entre le nombre de demande et le nombre de ce qui s'appelle "Utilisateurs/Comptes". Google fournit l'explication suivante :
".... il ne s'agit pas du nombre total d'utilisateurs qui ont fait l'objet d'une demande auprès de Google. [...]le même compte Gmail peut être indiqué dans plusieurs demandes d'informations relatives à un utilisateur, une fois dans une citation à comparaître et une autre fois dans un mandat de perquisition. Nous ajoutons les deux cas au total comptes/utilisateurs, bien qu'il s'agisse du même compte. De même, il est possible qu'une demande concerne un utilisateur ou un compte qui n'existent pas. [...] Nous nous efforçons de réduire ce phénomène, mais nous avons estimé qu'il était préférable de comptabiliser plus de comptes que pas assez.
Des juristes pourraient être intéressés par ce type de distinctions.
En conclusion : poursuivre nos investigations
Ce tableau nous apporte deux types d'information pour un fournisseur (ici Google) :
- au niveau d'un pays
- comparaison entre pays. Ici des traitements sont nécessaires
Une étude entre fournisseurs pourrait être également intéressante [1]. Peut il y avoir des corrélations entre les pratiques d'un pays ("France est le cinquième pays au monde qui interroge le plus Facebook") et le nombre de demande ? ou bien cela relève-t-il plutôt de pratique d'un pays [2] ? ...
A suivre
[1] Un beau travail d'analyse/synthèse pourrait être faite sur un ensemble de fournisseur - Facebook, Bing/MS, ....
- Google - http://www.google.com/transparencyreport/userdatarequests/?hl=fr
Procédures légales : http://www.google.com/transparencyreport/userdatarequests/legalprocess/
FAQ - http://www.google.com/transparencyreport/userdatarequests/faq/
- Facebook - https://govtrequests.facebook.com/
- Twitter - https://transparency.twitter.com
- Microsoft - http://www.microsoft.com/about/corporatecitizenship/en-us/reporting/transparency/
- Yahoo - https://transparency.yahoo.com/
[2] Le gouvernement français surveille les internautes sur Facebook - http://www.chaos-controle.com/archives/2014/04/14/29662478.html
Les commentaires récents