Reconstruindo Alexa: como a Amazon está misturando modelos, agentes e uso de navegador para uma IA mais inteligente

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saiba mais
A Amazon está apostando na interoperabilidade de agentes e na mistura de modelos para tornar sua nova assistente de voz Alexa mais eficaz, reformulando seu principal assistente de voz com recursos de agente e tarefas de uso do navegador.
Esta nova Alexa foi renomeada para Alexa+, e a Amazon está enfatizando que esta versão “faz mais”. Por exemplo, agora ela pode informar proativamente aos usuários se um novo livro de seu autor favorito está disponível, ou que seu artista favorito está na cidade — e até mesmo oferecer a compra de um ingresso. A Alexa+ raciocina por meio de instruções e toca em “especialistas” em diferentes bases de conhecimento para responder a perguntas do usuário e concluir tarefas como “Onde fica a pizzaria mais próxima do escritório? Meus colegas de trabalho vão gostar? — Faça uma reserva se você acha que eles vão gostar.”
Em outras palavras, o Alexa+ combina agentes de IA, capacidades de uso de computadores e conhecimento que ele aprende do ecossistema maior da Amazon para ser o que a Amazon espera ser um assistente de voz doméstico mais capaz e inteligente.
O Alexa+ atualmente roda nos modelos Nova da Amazon e modelos da Anthropic . No entanto, Daniel Rausch, VP de Alexa e Echo da Amazon, disse à VentureBeat que o dispositivo permanecerá "agnóstico de modelo" e que a empresa poderia introduzir outros modelos (pelo menos modelos disponíveis na Amazon Bedrock ) para encontrar o melhor para realizar tarefas.
“[É sobre] escolher as integrações certas para concluir uma tarefa, descobrir o tipo certo de instruções, o que é preciso para realmente concluir a tarefa e, então, orquestrar a coisa toda”, disse Rausch. “A grande coisa a entender sobre isso é que Alexa continuará a evoluir com os melhores modelos disponíveis em qualquer lugar da Bedrock.”
A mistura de modelos ou roteamento de modelos permite que empresas e outros usuários escolham o modelo de IA apropriado para explorar em uma base de consulta por consulta. Os desenvolvedores recorrem cada vez mais à mistura de modelos para cortar custos. Afinal, nem todo prompt precisa ser respondido por um modelo de raciocínio; alguns modelos executam certas tarefas melhor.
A unidade de nuvem e IA da Amazon, AWS , há muito tempo é uma defensora da mistura de modelos. Recentemente, anunciou um recurso no Bedrock chamado Intelligent Prompt Routing , que direciona os prompts para o melhor modelo e tamanho de modelo para resolver a consulta.
E poderia estar funcionando. “Posso dizer que não posso dizer para qualquer resposta dada da Alexa em qualquer tarefa dada qual modelo ela está usando”, disse Rausch.
Rausch disse que o Alexa+ reúne agentes de três maneiras diferentes. A primeira é a API tradicional; a segunda é implementar agentes que podem navegar em sites e aplicativos como o Computer Use da Anthropic ; a terceira é conectar agentes a outros agentes.
“Mas no centro de tudo isso, orquestrando todos esses diferentes tipos de experiências, estão esses LLMs básicos, muito capazes e de última geração”, disse Rausch.
Ele acrescentou que, se um aplicativo de terceiros já tiver seu próprio agente, esse agente ainda poderá falar com os agentes que trabalham dentro do Alexa+, mesmo que o agente externo tenha sido criado usando um modelo diferente.
Rausch enfatizou que a equipe Alexa usou as ferramentas e a tecnologia da Bedrock, incluindo novas ferramentas de orquestração multiagente .
O CPO da Anthropic, Mike Krieger, disse ao VentureBeat que mesmo versões anteriores do Claude não conseguirão realizar o que o Alexa+ deseja.
“Um momento realmente interessante de 'Por que agora?' é aparente na demonstração, porque, é claro, os modelos melhoraram”, disse Krieger. “Mas se você tentasse fazer isso com o Sonnet 3.0 ou nossos modelos de nível 3.0, acho que você teria dificuldades de várias maneiras para usar muitas ferramentas diferentes ao mesmo tempo.”
Embora nem Rausch nem Krieger tenham confirmado qual modelo específico da Anthropic a Amazon usou para criar o Alexa+, vale ressaltar que a Anthropic lançou o Claude 3.7 Sonnet na segunda-feira, e ele está disponível na Bedrock.
O primeiro contato de muitos usuários com IA veio por meio de assistentes de voz de IA como Alexa, Google Home ou até mesmo Siri da Apple. Eles permitem que as pessoas terceirizem algumas tarefas, como acender as luzes. Eu não tenho um dispositivo Alexa ou Google Home, mas aprendi recentemente o quão conveniente pode ser ter um quando estou hospedado em um hotel. Eu poderia dizer à Alexa para parar o alarme, acender as luzes e abrir uma cortina enquanto ainda estava debaixo das cobertas.
Mas enquanto Alexa, dispositivos Google Home e Siri se tornaram onipresentes na vida das pessoas, eles começaram a mostrar sua idade quando a IA generativa se tornou popular. De repente, as pessoas queriam mais respostas em tempo real de assistentes de IA e exigiam resoluções de tarefas mais inteligentes, como adicionar várias reuniões a calendários sem a necessidade de muita solicitação.
A Amazon admitiu que a ascensão da IA de geração, especialmente agentes, tornou possível que a Alexa finalmente atingisse seu potencial.
“Até este momento, estávamos limitados pela tecnologia que a Alexa poderia oferecer”, disse Panos Panay, vice-presidente sênior de dispositivos e serviços da Amazon, durante uma demonstração.
Rausch disse que a esperança é que o Alexa+ continue a melhorar, adicione novos modelos e, quem sabe, deixe mais pessoas confortáveis com o que a tecnologia pode fazer.
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós damos a você informações privilegiadas sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para obter o máximo de ROI.
Leia nossa Política de Privacidade
Obrigado por assinar. Confira mais boletins informativos do VB aqui .
Ocorreu um erro.

venturebeat