Der CEO von Perplexity sieht KI-Agenten als das nächste Web-Schlachtfeld

Perplexity nutzt die Möglichkeiten der generativen künstlichen Intelligenz – mit all ihren problematischen Tendenzen –, um Google als dominierende Plattform für die Informationssuche im Internet herauszufordern.
Das KI-Suchtool erlangte 2024 an Bekanntheit und wurde als vielversprechende Alternative zu Google gepriesen . Wie andere KI-Anbieter wurde der Dienst jedoch wegen angeblicher Urheberrechtsverletzung verklagt . Forbes warf ihm Plagiate in seinen Nachrichtenartikeln, die genaue Paraphrasierung anderer Websites und die Halluzination falscher Informationen vor.
Trotz des Aufruhrs gibt Perplexity heute an, dass sein Dienst 650 Millionen Anfragen pro Monat erhält und strebt angeblich Investitionen an , die das Unternehmen auf 18 Milliarden Dollar bewerten würden. Das Unternehmen treibt KI-Assistenten für Mobilgeräte voran und arbeitet an einem eigenen Webbrowser . Im April kündigte Motorola an, dass Perplexity im Lieferumfang seiner neuen Razr Ultra-Telefone enthalten sein wird. Letzten Monat ging das Unternehmen eine Partnerschaft mit PayPal ein, um Nutzern den Kauf von Produkten mithilfe des Assistenten zu erleichtern. Laut einem Bericht von Bloomberg soll sich Samsung auch in Gesprächen befinden, um Perplexity möglicherweise in seine Geräte zu integrieren . (Perplexity lehnte es nach dem Interview ab, sich dazu zu äußern.)
Perplexity-CEO Aravind Srinivas sprach per Telefon und E-Mail mit Will Knight, leitender Redakteur bei WIRED.
Dieses Gespräch wurde aus Gründen der Klarheit und Kürze bearbeitet.
WIRED: Der PayPal-Deal scheint wichtig für die Vision zu sein, die jeder von seinen Agenten hat. Ist E-Commerce die ultimative „Agenten-App“?
Aravind Srinivas: Agenten sind die ultimative App für alles. Sie ermöglichen Nutzern das optimale Erlebnis. Manche Menschen shoppen und recherchieren gerne, andere möchten das für sich erledigen lassen. Dazwischen gibt es ein breites Spektrum, und unser Fokus liegt auf dem optimalen Nutzererlebnis.
Apropos Erfahrung: Makler machen immer noch Fehler. Was passiert, wenn sie versehentlich etwas kaufen?
Händler und Käufer haben sich seit der Antike an jede neue Technologie angepasst. Wir zeigen ihnen einfach, was möglich ist, und sie entscheiden. Jede erfolgreiche Technologie musste Sicherheit und Fehlerbehebung sehr ernst nehmen, und das wird sich nicht ändern.
Die Integration von KI in persönliche Geräte ist ein weiteres großes Thema. Warum ist Ihnen der Motorola-Deal wichtig?
Das ist eine große Sache, denn Motorola ist eine der größten Telefonmarken der Welt. Diese Partnerschaft ermöglicht es uns, vertrauenswürdige KI zugänglicher denn je zu machen. Indem wir Perplexity Millionen von Menschen weltweit nativ und nahtlos vorstellen, können noch mehr Menschen sehen, wie viel mehr mit der Suche tatsächlich möglich ist.
Würden Sie in Erwägung ziehen, irgendwann eigene Geräte zu entwickeln?
Wir konzentrieren uns darauf, den besten KI-Assistenten und die beste Antwortmaschine zu entwickeln.
Motorola wird weitere KI-Assistenten anbieten. Wie wird sich Perplexity also von anderen abheben?
Mit der zunehmenden Verbreitung von KI-Assistenten werden Genauigkeit und Vertrauen noch wichtiger. Ein Assistent ist wenig nützlich, wenn er unzuverlässig ist. Schlimmer noch: Ist ein Assistent irreführend oder unterwürfig, dann ist er kein Assistent – er ist ein Manipulator. Das ist nicht nur nutzlos, sondern auch gefährlich. Ungenaue KI hat einen negativen kumulativen Effekt, und wir waren schon immer führend in der Entwicklung von KI und KI-Assistenten, die auf Genauigkeit und Überprüfbarkeit ausgerichtet waren. Das wird einen positiven kumulativen Effekt haben.
Aber warten Sie … Perplexity wurde – wie andere KI-Suchmaschinen auch – dafür kritisiert, dass es halluziniert und Fehler macht.
Wir freuen uns über diese Kritik, denn sie ist für uns der beste Weg, uns kontinuierlich zu verbessern. Tatsächlich machen Fehler nur einen kleinen Teil der Ergebnisse aus, und unsere Antworten sind weitaus genauer als zehn blaue Links, die durch jahrzehntelangen SEO-optimierten Content verunreinigt sind. [Auf eine Nachfrage gab Perplexity keine weiteren Details zu den Fehlerquoten bekannt, aber Jesse Dwyer, ein Sprecher, erklärte, die Zuverlässigkeit verbessere sich ständig.] Tatsächlich werden Genauigkeit und Vertrauen jedoch immer wichtiger, je mehr KI in unser Leben integriert wird. Deshalb konzentrieren wir uns unermüdlich darauf. Ohne dieses Feedback können wir das nicht erreichen.
Perplexity kopiert in seiner „Entdecken“-Rubrik auch urheberrechtlich geschützte Nachrichtenartikel. Können Sie verstehen, warum manche Verlage verärgert sind?
Diese Frage haben wir bereits beantwortet. Lesen Sie unseren Blogbeitrag darüber, wie wir robots.txt [eine Datei, die Websites hinzugefügt wird und angibt, ob Webcrawler auf ihre Inhalte zugreifen dürfen] berücksichtigen.
Der Perplexity-Assistent für Android und iOS wirkt „agentenhaft“, da er Aktionen ausführen kann. Wie groß ist dieser Wandel?
KI kann Fragen mittlerweile recht gut beantworten. Was wirklich nötig ist, ist, KI zum Handeln zu bewegen. Man spricht oft von „Agenten“; man kann es beliebig verwenden – „Agent“ oder „Assistent“ –, aber letztendlich muss KI Tools verknüpfen und Aktionen ausführen. Deshalb entwickeln wir [auch] einen Browser und einen Assistenten für iOS und Android.
Haben Apple und Google im Vergleich zu Außenstehenden, die Agenten entwickeln möchten, zu viel Kontrolle über ihre mobilen Plattformen?
Unter iOS ist es besonders anspruchsvoll, da man eine Reihe von Event-APIs verknüpfen muss. Unter iOS sind Mail, Kalender, Erinnerungen und Podcasts nativ über das Apple SDK (Software Development Kit zum Erstellen von Anwendungen) verfügbar. So kann man ganz einfach E-Mails verfassen, Meetings planen, verschieben, Erinnerungen einrichten und Podcasts öffnen. Man kann nach Podcasts suchen … „Gib mir den Podcast, in dem Mark Andreessen mit Joe Rogan über De-Banking spricht.“ Das geht ziemlich schnell.
Es ist vor allem deshalb schwierig, weil man nicht auf andere Apps zugreifen kann. iOS unterscheidet sich kaum von Android, da KI auch dort nicht auf die meisten Apps zugreifen kann (was bedeutet, dass der Perplexity-Assistent mit manchen Apps einfacher interagieren kann als mit anderen). Apps von Drittanbietern können ihre SDKs jedoch so erstellen, dass sie über das Android SDK zugänglich sind. Beispielsweise kann unser Android-System einen Song auf Spotify anzeigen. Unter iOS kann man nur auf einen bestimmten Spotify-Song verlinken und muss die Audiowiedergabe manuell starten.
Oh, es sind also die App-Entwickler, die KI-Agenten zurückhalten?
Das ist die Herausforderung. Wenn uns Leute APIs anbieten – beispielsweise Open Table, Uber, DoorDash oder Instacart –, mit denen wir auf Informationen innerhalb der App zugreifen können, ohne die App öffnen zu müssen, ist das im Backend ziemlich leistungsfähig. Wenn wir beispielsweise Informationen zu Uber abrufen und feststellen, dass Uber Comfort nicht mehr als 5 bis 10 Prozent von Uber X kostet, können wir Uber Comfort einfach für Sie buchen – sofern Sie dies bei Perplexity eingestellt haben.
Oder wir können das beste Thai-Restaurant in Ihrer Nähe finden und mir eine Lieferung zukommen lassen – viel schneller, als wenn wir die DoorDash-App öffnen, nach Thai-Essen suchen, alle Optionen durchgehen, Bewertungen lesen, die Adresse eingeben, bezahlen und so weiter. Wir könnten das alles in unserem System abbilden und das Erlebnis deutlich nahtloser und einfacher gestalten. Ich denke, das ist die Zukunft, aber die Leute müssen uns ihre Apps öffnen, und wir müssen sehen, wer bereit ist, was zu tun.
Besteht das größte Problem nicht darin, dass KI-Agenten einfach noch nicht besonders intelligent und nützlich sind?
Meine Analogie [für KI-Agenten] ist, dass wir uns an einem Punkt befinden, an dem sich Perplexity im Jahr 2022 befand [kurz vor seinem Durchbruch]. Es ist nicht so, dass wir alle Antworten richtig hätten. Manche Leute machten sich über Halluzinationen lustig, und manche nennen es „Google in Makrosekunden“. So weit war es noch nicht.
Es kam erst viele Monate später richtig in Gang, als die Modelle besser wurden, und ich erwarte den gleichen Trend bei den Agenten und Assistenten. Es wird einige Dinge geben, die wirklich funktionieren, alltägliche Anwendungsfälle, und es wird eine lange Reihe von Dingen geben, die nicht funktionieren und die wir im Laufe der Zeit weiter verbessern werden.
Aber genau deshalb entwickeln wir einen [Web-]Browser, denn die Browser-Oberfläche ermöglicht es Ihnen, die Arbeit auch selbst zu erledigen, wenn Sie mit der KI-Leistung nicht zufrieden sind. So können wir daraus lernen und das Problem mit der Zeit beheben. Das autonome Fahren von Waymo und Tesla funktionierte lange Zeit nicht. Heute halten die Leute es für selbstverständlich. Ich denke, bei uns läuft es ähnlich.
Haben Sie deshalb die Idee ins Spiel gebracht, dass Perxplexity die Kontrolle über Chrome übernehmen könnte – falls Google gezwungen wäre, sich davon zu trennen?
Wir sagen nicht, dass wir an einem Kauf von Chrome interessiert sind. Wir sagen nur: Wenn es keinen anderen Weg gibt und Google in die Situation kommt, Chrome zu veräußern, wären wir bereit, es weiterzuführen. Google sollte sich aber nicht von Chrome trennen müssen, da Chrome und Chromium eng miteinander verknüpft sind.
Chromium ist ein Open-Source-Projekt, das von Google sehr [gut] betrieben wird, und es ist der Grund für Microsoft Edge und den Brave-Browser.
OpenAI hat ebenfalls Interesse daran gezeigt, die Kontrolle über Chrome zu übernehmen.
Die Übertragung der Rechte an Chrome oder Chromium an ein Unternehmen wie OpenAI wäre eine Katastrophe, da Open Source und OpenAI derzeit ein Widerspruch in sich sind. [OpenAI reagierte nicht auf eine Anfrage um Stellungnahme. Das Unternehmen kündigte an, diesen Sommer ein Open-Source-KI-Modell zu veröffentlichen.]
Es gibt nur zwei Unternehmen, die Chrome wirklich betreiben könnten: Microsoft und Meta. Ehrlich gesagt würde Microsoft Chrome ruinieren, genau wie Edge. Und die Übertragung von Chrome auf Meta bedeutet, Chrome von einem Monopol auf ein anderes zu übertragen. [Die FTC hat Klage eingereicht und Meta vorgeworfen, als Social-Networking-Monopol zu agieren; das Unternehmen argumentiert, dies sei nicht der Fall .]
Wofür werden Agenten Ihrer Meinung nach in erster Linie nützlich sein?
Ich denke, dass viele Ihrer persönlichen Suchvorgänge dadurch deutlich verbessert werden.
Fragen Sie zum Beispiel: „Welchen Artikel habe ich letzte Woche über dieses eine Unternehmen gelesen?“ oder „Können Sie meinen Feed X für mich zusammenfassen, damit ich weiß, was gerade angesagt ist?“, weil Sie nicht zu X gehen und sich davon ablenken lassen möchten. Oder: „Können Sie dieses Meeting mit dieser Person für mich vereinbaren und ihr im Falle einer Terminüberschneidung eine E-Mail mit der Bitte um einen anderen Termin schicken?“ Ich denke, all diese langweiligen Dinge werden wir [in Zukunft] ziemlich schnell automatisieren können.
wired