Trop lumineux pour moi, en passant, leur écran. Je dois avoir des problèmes de persistence rétinienne parce que je le vois clignoter. J'aurais dû prendre des lunettes de soleil 😕

Ils ont mis un microphone dans une peluche de la forme du logo de Facebook…qu'ils balancent à la tête des gens qui veulent poser une question 🤔

L'université de British Columbia n'est ni britannique, ni en Colombie, mais à Vancouver, au Canada 🤔

C'est chelou d'apprendre qu'il existe des “malaware companies”… jusqu'à ce qu'on comprenne que ce sont des compagnies qui détecte des logiciels malveillants, pas des compagnies qui les écrit ouvertement 😅

Follow

Ils ont entraîné une intelligence artificielle à faire la différence entre des huskys et des loups (qui sont difficiles à reconnaître l'un de l'autre). Ça marchait plutôt bien… jusqu'à ce qu'ils regardent le réseau de neurones et remarque que ce dernier a toute son attention sur les bords de l'image, en particulier là où il n'y a pas d'animal. Ben oui : toutes les photos de loups étaient sur fond neige, et les huskys sur du gazon, du coup leur réseau de neurones ne faisait que reconnaître la neige 😂

Le hic, c'est que l'histoire s'est répetée lorsqu'ils cherchaient des logiciels malveillants : si ce dernier utilisait une certaine bibliothèque (de cryptographie), c'était souvent des logiciels malveillants, et si ce dernier proposait de se connecter dia Facebook, c'était rarement un logiciel malveillants… arf, ce n'est pas exactement ce qu'ils voulaient détecter 😕

Tony Hoare qui fait remarquer que les travaux de la personne qui présente ne respectent pas le critère de Popper parce que les travaux sont protégés par le secret industriel… et ne sont donc pas scientifiques 👍

Le genre de logiciels malveillants qu'ils essayent de rechercher : il y avait un jeu à la mode sur les systèmes Android il y a quelques années. Le jeu était simple, mais sympa. Le hic, c'est que la nuit, le jeu se lançait en arrière plan. Il espionnait le comportement du téléphone pendant une dizaine de minutes. Si le programme concluait que personne n'utilisait le téléphone, il se mettait à miner des monnaies cryptographiques 😕

Dans l'idée de pourquoi c'est un problème : ils ont pris des vrais logiciels malveillants (et bien détectés comme malveillants par la plupart des détecteurs) et ont ajouté des bibliothèques tierces à ces derniers. Ces bibliothèques n'étaient pas utilisées du tout : les ajouter ne changeait pas leur comportement du tout. Le truc, c'est que que tous les analyseurs voyaient ces programmes comme non malveillants en conséquence.

Conclusion : l'intelligence artificielle pour détecter du code malveillant, c'est assez bof bof en ce moment. 😕

Chez Facebook, on aime aller vite. Mais pas trop non plus 🙃

(Le Braille est en niveau 1, comme tout le du bâtiment que j'ai vu jusque là. Est-ce parce qu'ils visent plutôt l'international ?)

Je continue mes pouets en direct 😊

Le présentateur qui met juste un lien ArXiv sans mettre le titre ou les auteurs dans les planches… pffff. À ce niveau là mettez un QR-code, quoi : je ne vais pas me souvenir du numéro ISBN là comme ça 😕

Quelqu'un fait de la reconnaissance automatique de grammaire. On demande ce qui se passe si on lui fait deviner une grammaire context-sensitive. Le présentateur réponds qu'il n'a jamais vu de grammaire context-sensitive en dehors de ses cours théoriques à l'université. Et comme il bosse dans l'industrie, c'est que ça n'existe pas ?

Alors.

La grammaire de R est context-sensitive : le parseur change une variable globale qui est lue par le lexeur, ce qui change son comportement. Le moyen de formaliser tout ça proprement, c'est par une grammaire sensible au contexte.

En JavaScript, allez voir la “Semicolon insertion” : que du context-sensitive.

Rappel quotidien que le C et le Java, ce sont des langages jouets par rapport à la complexité de langages comme JavaScript ou R.

Une question à quelqu'un qui présente le projet Sapienz, un programme racheté par Facebook qui teste automatiquement des applications en cliquant au hasard sur tous les boutons. Quelqu'un demande s'ils ont accès à des tests effectifs d'utilisateur. La personne répond que bien entendu on n'espionne pas les utilisateurs chez Facebook. Ça serait illégal, non ? Rires dans la salle.

Présentation sur la génération de programme. L'exemple donné par la personne qui présente présente un oubli évident. Personne ne pose la question parce que c'est trivial à changer.

Ah si, quelqu'un pose la question. Et la personne qui présente ne comprend bien pas la question ! Après quelques moments, elle dit « Ah si, peut-être, j'imagine ». Outch ! Ça doit être un doctorant qui a fait la recherche et qui devrait présenter à la place du professeur 😕

La personne commence la présentation en parlant d'assistants de preuve. Ensuite la personne parle de spécifications par induction. Sauf que le mot induction n'est pas du tout le même dans les deux contextes : quand on parle d'induction dans un assistant de preuve, on pense tout de suite au calcul des constructions — mais la personne utilise « induction » dans le sens philosophique ici ! Ce n'est pas de sa faute (ces mots sont effectivement standards dans les deux communités), mais c'est dommage 😕

La synthèse de programme, ça marche. Exemple : sur Excel, lorsque vous complétez une colonne, Excel propose des autocomplétions sur toute la colonne en utilisant de la synthèse de programme. Genre dans une colonne, vous avez :

JAN
FEB
MAR
APR

DEC

Si dans la deuxième colonne vous commencez à taper « January », Excel vous propose la complétion suivante :

January
Febuary
Maruary
Apruary

Decuary

Presque juste 😅

Je me moquais d'un chercheur dont je n'apprécie pas trop l'ego sur un groupe de discussion. (Disons que quand tu n'est pas le premier à publier une idée, c'est assez culotté de dire que tu as eu cette idée toute nouvelle.) On me fait remarquer qu'un de ses co-auteurs est dans le groupe en question. Oups 😅

Les produits hygiéniques féminins dans les toilettes, y compris dans les toilettes des hommes, c'est vraiment bien, en passant ! 😀

Un chercheur d'Apple demande à ce qu'il n'y ait ni photo ni vidéo parce qu'il veut pouvoir dire du mal d'Apple 😅

Ça parle de géolocaliseurs : comment utiliser l'intelligence artificielle pour trouver l'adresse associée à une recherche.

Ensuite la présentation montre tous les problèmes associés aux cartes. On a l'impression qu'il veut utiliser l'intelligence artificielle pour tout résoudre 🙃

C'est intéressant : ils veulent mettre en place un système à la Osmose (pour OpenStreetMap) mais pour Apple, et ils se posent la question de comment bien le faire ☺️

De manière assez surprenante, ils font pour l'instant les tests sur toute la carte et non par diffs parce que certains tests sont globaux et complexes. Leur approche est aussi étonnante : ils veulent restreindre l'expressivité des éditeurs (et donc des commits) pour éviter le plus possible de conflits. Le but est justement de pouvoir le faire commit par commit… mais certains tests sont très complexes !

Je pose une question en faisant remarquer que quand je vois une différence entre OpenStreetMap et la réalité, je change la carte en direct, alors que de ce qu'il dit, Apple refuse de le faire sans effectuer beaucoup, beaucoup de vérifications.

Ça doit être une différence de culture : il me pose la question « et si je me trompe ? » La culture Wikipédia ne semble pas encore avoir fait son chemin à Apple. 😕

Je comprends le besoin de faire des tests. Mais je ne comprends pas qu'on ne donne pas la priorité à celui qui est sur place. Il donnait même un exemple où les tests (écrits par des étasuniens, forcément) refusaient tous les numéros de rue russe parce qu'ils ne respectaient pas les normes attendues au États-Unis. Ben oui, et alors ? C'est une rue russe, pas étasunienne ! 🙃

On n'est jamais certain s'il est sérieux ou non 😂

Genre : « Non mais chez Apple, on a fait pas mal d'efforts. On est bon maintenant. Je me souviens même d'un moment où le chemin proposé par Apple Maps était meilleur que celui de Google Maps, c'est pour dire ! »
Personne ne rigole, il a l'air d'avoir convaincu l'audience. Alors qu'il vient littéralement de dire que dans son usage quotidien de l'application, il ne se souvient que d'un seul et unique cas avec un meilleur résultat 🤔

Bon, c'est une conférence organisée par les Gafam, genre à 100 %, mais même comme ça, je trouve ça fou de rester en mode Autruche : les cartes d'OpenStreetMap sont infiniment plus précises et plus à jour que Google et Apple, à la fois en campagne et en ville. Les points où les Gafam sont meilleurs sont : la géolocalisation (associer des coordonnées à une adresse tapée par l'utilisateur), les commerces, certains types le recherche de chemin (voiture, essentiellement). Certainement pas la carte ! 🤦

Une question sur la dépense d'énergie des tests. Question très intéressante !

Plus de temps pour répondre, malheureusement. Mais ils indiquent que cela ne fait pas encore partie des priorités de l'entreprise.

Ils pensent repérer à l'avenir des anti-patterns, du genre allumer le GPS trop tôt dans l'application, à un moment où ce n'est pas encore vraiment important. C'est cool, mais c'est quelque chose qui se focalise à la partie exécutée sur les téléphones… ce qui n'est pas l'essentiel des consommations de l'entreprise pour des calculs 😕

Show more

Une histoire similaire : ted.com/talks/janelle_shane_th (vers 6mn)

Une intelligence artificielle qui est censée reconnaître un certain type de poissons. Ça a l’air de bien fonctionner. Quand on demande au programme de montrer des bouts d’image caractéristiques du poissons, on ne voit que des bouts de doigts humains. Euh…

La raison est que ce poisson particulier est un poisson considéré comme un trophée : la première chose que la plupart des pêcheurs font lorsqu’ils attrapent ce poisson, c’est se photographier en le portant. Du coup les photos de ce poisson on tendance à avoir des doigts humains quelque part dans la photo. Et forcément, le programme n’est pas au courant que ces doigts ne font pas partie du poisson 😅​

@MartinShadok
Sur cette histoire de mauvais apprentissage husky/loup vs neige/gazon, exsite-t-il une référence extérieure ?

@GuyMarty Il y avait une référence sur les planches. Je n'ai pas le temps d'aller voir ça maintenant, mais si je ne réponds pas dans la semaine, remémore moi de chercher 😊

@GuyMarty Bon, @guillaume a trouvé la référence, merci 😊
Voilà le papier : arxiv.org/abs/1602.04938
Il semblerait que c'était volontaire de la part des auteurs : le but était de voir à quel point on peut faire confiance aux machine-learning, justement ☺️

@MartinShadok Dans des support de présentation j’ai l’habitude de mettre le 1er auteur et la date seulement. Trop long sinon. J’me dit qu’avec le contexte ça se retrouve vite.

@freetux C'est possible. Il ne faut pas surcharger les planches. Si les planches sont disponibles sur Internet, on peut mettre un lien cliquable. Mais mettre un lien dans une planche sans autre information pour une référence, je trouve ça chaud 😕

@MartinShadok Avec Beamer c’est pratique, dans ma soutenance j’avais [auteur,date] et à la fin du pdf j’avais toutes les références si-besoin automatiquement. Y’a pas à dire, c’est super pratique. 🙂

@Lapineige Très bonne question 😊
J'en parle un petit peu dans ce fil : aleph.land/@MartinShadok/10230

Dans l'idée (ça change suivant les langues), il y a globalement deux niveaux de Braille. Le niveau 1 est très simple : chaque caractère encré est représenté par un unique caractère braille (à l'exception des changements de mode comme, ⠼ ou ⠠, ou en français ⠨). Il est de plus très universel : le caractère ⠁ est toujours associé au caractère a ou équivalent (א, α, etc.) dans toutes les langues.

Le problème, c'est que le Braille prend de la place, beaucoup plus de place qu'un document encré ! Il est donc important de condenser le Braille autant que possible. C'est là qu'intervient le niveau 2 : c'est tout un système d'abréviations pour gagner de l'espace 😊 Mais il est spécifique à la langue : quand j'étais en Autriche, tout était écrit en Braille niveau 2, et j'ai mis un petit peu de temps à m'adapter (enfin… je ne suis pas aveugle, donc bon). On devine vite, mais la première fois, ça fait tout drôle 😊

@Lapineige J'aurais pu mettre un exemple 😊
Dans l'image ci-dessus, on peut lire « ⠎⠇⠕⠺⠀⠙⠕⠺⠝⠂⠀⠽⠕⠥⠀⠍⠕⠧⠑⠀⠞⠕⠕⠀⠋⠁⠎⠞ ». C'est du niveau 1 (Braille grade 1).
En niveau 2 (anglais), ça donnerait (sauf erreur de ma part) « ⠎⠇⠪⠀⠙⠪⠝⠂⠀⠽⠀⠍⠕⠧⠑⠀⠖⠕⠀⠋⠁⠌ ». (Quoique ⠖ est déprécié : à la place de ⠖⠕, on mettrait plutôt juste ⠞⠕⠕ maintenant.)

@MartinShadok Cas classique en apprentissage automatique. Je me souviens d'une démo militaire, découvrir si un tank était caché dans le paysage, et les photos avec le tank avaient été prises le matin, celles sans l'après-midi. Le réseau de neurones avait juste noté la différence de lumière.

@guillaume Merci beaucoup pour la référence ! 😀 En plus l'article parle des huskys, c'est cool 😊
Mais du coup… ça ressemble à une légende urbaine. Bon.

@MartinShadok
Le biais cognitif cybernétique !
Il ne manquait plus que ça 😅

@djayroma En vrai, c'est très fréquent, les biais en machine learning. Quasiment tous les résultats sont complètement biaisés par les données utilisées, qui ont souvent un nombre assez conséquent d'hommes blancs. Les gens qui disent que le machine learning est neutre n'ont souvent pas compris grand chose au machine learning… 😕

@djayroma Le problème est même avant : pas mal d'appareils photo sont échantillonnés pour que les blancs aient de bonnes photos. Souvent les personnes de couleur apparaissent avec un contraste assez mauvais à cause de cet échantillonnage. L'exemple qui me choque le plus, ce sont les spécifications pour les photos de passeport en France. Une photo d'un noir est montrée en exemple de photo avec un mauvais contraste : demarches.interieur.gouv.fr/pa
Et ensuite certains disent que les noirs ne sont pas bien gérés par le machine learning… ben c'est avant tout qu'on produit des capteurs incapables de bien les photographier à la base 🤦

Sign in to participate in the conversation
Aleph

Generalistic Mastodon instance for open-minded people. Instance Mastodon généraliste pour personnes ouvertes d'esprit.