03 octobre 2006
La machine à traduire de Google
google
Peter Norvig, le directeur de la recherche chez Google, a présenté la semaine passée quelques-unes des toutes nouvelles innovations de la société et le futur de l'analyse de données.
Il a d'abord présenté la Statistical Machine Translation, un logiciel de traduction toujours en cours de développement. Le but de ce programme est d'améliorer la précision de la traduction (on s'en serait douté), de la rendre plus humaine. C'est vrai que pour l'instant, Google Translate ne casse pas des briques.
Un logiciel de traduction est vraiment un super exemple de l'utilisation d'énormes quantités de données dans le but d'améliorer continuellement la précision d'un service pour tout le monde.
En résumé, ça veut dire qu'avec tous les services qu'il propose...
Mise à jour du 2 avril 07: ScientificAmerican revient sur la Statistical Machine Translation, expliquant que Google nourrit son algorithme avec une tonne de documents déjà traduits dans les principaux langages mondiaux.
Norvig a également cité d'autres projets de recherche qui découlent du même principe, comme l'amélioration du service sets, qui permet de fournir d'autres mots-clés en relation avec le mot-clé recherché ou encore une future application qui permettra de voir le volume des recherches sur un mot aux différentes périodes de l'année (un peu comme google trends, finalement...)
Source: The Daily Californian, la semaine passée.
Pour ceux qui ne savent pas:
- google books, google scholar ... au moins deux services dont le contenu est certifié à 99,9% sans spam, c'est-à-dire sans donnée faite pour tromper l'utilisateur, sans entourloupe. Bref, un contenu parfait pour le sujet qui nous occupe ici.
- deux nouvelles options sont apparues récemment dans google translate: Arabic-English et English-Arabic. Elles utilisent le prototype de cette Statistical machine translation. Voici quelques résultats de tests.
Il a d'abord présenté la Statistical Machine Translation, un logiciel de traduction toujours en cours de développement. Le but de ce programme est d'améliorer la précision de la traduction (on s'en serait douté), de la rendre plus humaine. C'est vrai que pour l'instant, Google Translate ne casse pas des briques.
Un logiciel de traduction est vraiment un super exemple de l'utilisation d'énormes quantités de données dans le but d'améliorer continuellement la précision d'un service pour tout le monde.
En résumé, ça veut dire qu'avec tous les services qu'il propose...
- la recherche classique sur Internet (google search);
- la recherche sur les blogs (blogger ou google blogsearch);
- la recherche dans la presse (google news);
- la recherche dans les livres (google books);
- la recherche dans les articles de la recherche (google scholar);
Mise à jour du 2 avril 07: ScientificAmerican revient sur la Statistical Machine Translation, expliquant que Google nourrit son algorithme avec une tonne de documents déjà traduits dans les principaux langages mondiaux.
Norvig a également cité d'autres projets de recherche qui découlent du même principe, comme l'amélioration du service sets, qui permet de fournir d'autres mots-clés en relation avec le mot-clé recherché ou encore une future application qui permettra de voir le volume des recherches sur un mot aux différentes périodes de l'année (un peu comme google trends, finalement...)
Source: The Daily Californian, la semaine passée.
Pour ceux qui ne savent pas:
- google books, google scholar ... au moins deux services dont le contenu est certifié à 99,9% sans spam, c'est-à-dire sans donnée faite pour tromper l'utilisateur, sans entourloupe. Bref, un contenu parfait pour le sujet qui nous occupe ici.
- deux nouvelles options sont apparues récemment dans google translate: Arabic-English et English-Arabic. Elles utilisent le prototype de cette Statistical machine translation. Voici quelques résultats de tests.
Libellés : google
archives >> fevrier10 - janvier10 - novembre09 - octobre09 - septembre09 - août09 - juillet09 - mars09 - février09 - janvier09 - decembre08 - novembre08 - octobre08 - septembre08 - août08 - juillet08 - juin08 - mars08 - fevrier08 - janvier08 - decembre07 - novembre07 - octobre07 - septembre07 - août07 - juillet07 - juin07 - mai07 - avril07 - mars07 - février07 - janvier07 - decembre06 - novembre06 - octobre06 - septembre06 - août06 - juillet06 - juin06 - mai06 - avril06 - mars06 - février06 - janvier06 - decembre05 - novembre05 - octobre05
Powered by Stuff-a-Blog
une page au hasard