"Pourquoi sur Terre voudrais-je parler à mon ordinateur ?"

Joshua Montgomery est le CEO et fondateur de Mycroft AI, une startup texane qui cherche à lancer un module opensource d'Intelligence Artificielle domestique. Il nous livre ici sa vision de l'avenir de l'interface utilisateur utilisant le langage naturel. Bonne lecture !


Pourquoi sur Terre voudrais-je parler à mon ordinateur ?

Quand je commencé mon premier emploi en informatique en 2000, j'ai eu la chance de travailler je fus assez heureux de travailler avec un titulaire de doctorat nommé Dan Vasacheck qui a pris le temps de me montrer comment utiliser l'ordinateur central Unix de l'entreprise. Bien que j'ai beaucoup appris de Dan, voici la meilleure perle de de sagesse que j'ai gardé - « Une interface utilisateur graphique (GUI) est l'équivalent de poiter et grogner, l'interface en ligne de commande (CLI) vous permet d'avoir une conversation avec votre l'ordinateur. »

Vous voyez, pour utiliser une interface de fenêtres, tout ce que vous avez vraiment besoin de faire est de déplacer le curseur de la souris sur une partie spécifique de l'écran (point) et cliquez (grogner). En fait, quand la technologie multi-touch est devenu disponible en 2005, elle a été saluée comme un progrès énorme dans l'interaction homme-machine. Vous pouvez maintenant zommer et dézoomet. Hou la la ! C'est comme si nous développions des outils de l'âge de pierre encore une fois.

La CLI, d'un autre coté, vous permet d'avoir une conversation avec l'ordinateur, le tout dans la langue de bois des ordinateurs. Les programmeurs ont développé une série de programmes et de services en couches dans un interpréteur de commande. Puisques les programmeurs sont paresseux par nature, ils ont abrégé les noms de programmes (« liste » est devenu "ls" par exemple) et ajoutés progressivement une série de paramètres ou des options sous la forme d'indicateurs de ligne de commande. Pour utiliser la CLI vous avez besoin de savoir quelle commande utiliser, qui indicateurs sont applicables et comment enchaîner les commandes ensemble. Si vous connaissez les secrets de cette langue, vous pouvez converser avec votre ordinateur d'une manière qui semblent magique pour les utilisateurs de l'interface graphique. A titre d'exemple, pour analyser un réseau distant et obtenir les adresses IP des ordinateurs qui répondent à ICMP vous devez taper :

nmap -sP -n -v 10.0.0.0/24 2> /dev/null | grep -i ‘to be up’ | cut -d ” ” -f 2

Cependant, la structuration de cette commande prend du temps et de l'expertise. Elle est souvent faite par essais et erreurs et même les utilisateurs chevronnés de la ligne de commande doivent constamment se référer au manuel d'utilisation. Pourquoi ? Parce que la syntaxe est archaïque, il n'y a pas de véritables normes entre les commandes (est-ce que "-n" signifie « nouveau » ou « nul ») Et même des versions légèrement différentes du même interpréteur de commandes ont une syntaxe différente.

Pour le dire en termes simples la CLI est l'équivalent d'une lettre officielle. Elle peut être utilisé pour communiquer sur à peu près tout, mais elle est bien trop mal foutue pour nos besoins quotidiens. Vous n'envoyez pas une lettre officielle à l'épicier une lettre officielle demandant où est conservé la garniture de tarte à la citrouille, vous marchez simplement vers lui et vous lui demandez.

Il ya une meilleure façon. La reconnaissance du langage naturel - le type de communication que nous utilisons tous les jours pour communiquer avec d'autres personnes. Jusqu'à récemment, ce type d'interface d'ordinateur était au-delà de la portée de la science informatique, mais elle est maintenant de plus en plus largement disponibles au alors que des entreprises comme Facebook, Google, Apple, Microsoft et Amazon ont investi respectivement dans M, Google Now, Siri, Cortana et Echo.

Alors pourquoi ces entreprises font des milliards de dollars d'investissements dans les interfaces en langage naturel ? Parce c'est l'avenir de l'interface homme-machine. Nous avons passé les 50 dernières années à apprendre aux gens à parler la langue des machines. C'est difficile, maladroit et ça prend des années d'expérience. Nous sommes maintenant à un moment où nous pouvons enseigner aux machines à parler la langue des humains - intuitive, facile à utiliser et naturelle. Avec le traitement du langage naturel, je peux avoir mon ordinateur qui numérise un réseau distant en disant simplement :

« Hey, Mycroft. Exécute un balayage de ping sur le sous-réseau 10.1.1.0/24 et liste-moi les adresses IP en cours d'utilisation. »

-ou-

« Hey, Mycroft. Quelles adresses IPs retournent ICMP sur le sous-réseau 10.1.1.0/24 ? »

Le traitement du langage naturel dans le système traduit mon discours en une série de commandes, les exécute, puis fournit une liste des résultats. Il n'y a aucune syntaxe standard, je donne la commande naturellement et l'ordinateur interprète les résultats. Pas besoin de mémoriser des indicateurs, les sortie de tuyaux d'une commande à l'autre, ou de se soucier de d'utiliser le mauvais indicateur. La compétence sous-jacente (qui dans ce cas présent a été développé par quelqu'un qui est un expert en CLI et en nmap) gère le langage des arcanes et fournit une liste proprement formatée d'adresses IP.

Sceptique? Je comprends. Les utilisateurs ont le droit d'être sceptiques, en particulier les utilisateurs qui utilisent la ligne de commande toute la journée. Les vendeurs ont vendu des logiciels de commande vocales cassés et essentiellement inutiles pendant plus de 15 ans maintenant. Même aujourd'hui, mon Chevy Volt est un excellent exemple - il a une interface vocale terrible qui est effectivement inutile. Pire, il est ses sources sont fermées et propriétaires, donc je ne peux pas tout simplement le remplacer par Mycroft ou le bidouiller pour qu'il convienne à mes besoins, mais c'est en train de changer.

Ici, à Mycroft nous développons une Intelligence Opensource qui permettra à quiconque ayant une idée de développer une compétence et de la déployer globalement. Vous voulez rendre facile pour les utilisateurs finaux d'obtenir le score du dernière match de football de la FIFA ? Utilisez notre modèle standard pour développer la compétence, charger la sur notre dépôt et rapidement chaque utilisateur Mycroft sur la terre sera en mesure de suivre la derniers scores de tout jeu de la FIFA.

La technologie pour faire une interface en langage naturel est là aujourd'hui. Nous pouvons construire une interface qui est intuitive, facile à utiliser, flexible et conviviale. Des milliards de personnes utilisent les premières versions sur leurs appareils Apple, Android et Windows. Dans l'avenir, ces interfaces seront un élément important de tout système d'exploitation de consommation moderne de la même manière que l'interface graphique est devenu un élément clé dans les années 1980.

Vous allez finir par passer votre journée à parler avec votre ordinateur, et ça va être génial.

source : Why on Earth would I talk to my computer? sur le blog de Mycroft AI

Version PDF/EPUB

blogroll

social