Perplexity AI, une entreprise qui ambitionne de rivaliser avec Google, a dévoilé une API de recherche innovante qui promet de transformer le paysage de la recherche en ligne. Avec une architecture avancée et une rapidité impressionnante, cette initiative vise à offrir aux développeurs une alternative performante pour accéder à des milliards de pages web en un temps record.
Les 3 points clés à retenir
- Perplexity AI lance une API de recherche qui promet des temps de réponse inférieurs à 400 millisecondes.
- Cette API repose sur une architecture multicouche combinant stockage massif et modèles d’apprentissage automatique.
- La tarification débute à 5 dollars pour 1000 requêtes avec des options de personnalisation selon les besoins des développeurs.
Une API de recherche rapide et performante
Perplexity AI a fait un grand pas en avant en lançant une interface de programmation qui permet aux développeurs de se connecter directement à son infrastructure de recherche. Avec des temps de réponse inférieurs à 400 millisecondes, cette API offre une rapidité inégalée sur le marché. Elle utilise un système de classement hybride qui combine des méthodes lexicales et sémantiques pour une efficacité maximale.
L’architecture de cette API est conçue pour gérer des volumes massifs de données, avec plus de 400 pétaoctets de stockage pour des données dites « chaudes ». Les modèles d’apprentissage automatique intégrés évaluent l’importance des URL en fonction de divers critères, garantissant ainsi une mise à jour continue et précise des informations disponibles en ligne.
Processus de récupération et classement des données
Le processus de récupération de l’API de Perplexity est structuré en plusieurs étapes. Une première récupération hybride génère des candidats, suivie d’un préfiltrage qui élimine les contenus non pertinents. Ensuite, un classement progressif utilise des modèles lexicaux, sémantiques et des cross-encodeurs pour comparer la requête aux extraits de texte.
Cette méthode permet de réduire considérablement la latence médiane, atteignant 358 millisecondes, bien en dessous des 1375 millisecondes observées chez certains concurrents. De plus, le module de compréhension de l’API est capable de décomposer chaque page web en fragments, ce qui lui permet de s’adapter à la structure spécifique de chaque site sans perdre d’informations essentielles.
Modèles Sonar et tarification
L’API de Perplexity est soutenue par les modèles Sonar, qui sont construits sur la base de Llama 3.3 70B et optimisés pour la recherche. Les variantes de Sonar incluent Sonar standard, Sonar Pro et Sonar Reasoning, chacune étant adaptée à des besoins spécifiques.
Le modèle Sonar standard se distingue par sa vitesse de décodage, atteignant 1200 tokens par seconde, ce qui le rend près de 10 fois plus rapide que d’autres modèles comparables. Dans des évaluations comparatives, Sonar a surpassé des modèles tels que GPT-4o mini et Claude 3.5 Haiku, tout en offrant un coût d’utilisation réduit.
La tarification de l’API est stratégiquement positionnée pour attirer les développeurs, avec un coût de 5 dollars pour 1000 requêtes pour le modèle Sonar standard. Les coûts pour l’entrée et la sortie de tokens varient entre 1 et 2 dollars par million pour l’entrée et entre 5 et 8 dollars par million pour la sortie, selon les modèles de raisonnement utilisés.
Contexte de Perplexity AI
Perplexity AI est une entreprise technologique qui s’est démarquée par son approche novatrice de la recherche en ligne. En combinant des capacités avancées d’intelligence artificielle avec des technologies de recherche de pointe, elle s’efforce de proposer des solutions compétitives face aux géants établis comme Google. L’ambition de Perplexity est de redéfinir les standards de l’efficacité et de la rapidité dans le domaine de la recherche sur Internet.
En se concentrant sur l’innovation et l’accessibilité, Perplexity AI continue de développer des produits et des services qui répondent aux besoins variés des utilisateurs et des développeurs, tout en cherchant à étendre son influence dans le secteur technologique mondial.