A IA ainda tem um problema de alucinação: como o MongoDB pretende resolvê-lo com rerankers avançados e modelos de incorporação

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saiba mais
Para obter o melhor resultado possível de uma consulta de IA, as organizações precisam dos melhores dados possíveis.
A resposta que muitas organizações tiveram para superar esse desafio é a geração aumentada de recuperação (RAG). Com a RAG, os resultados são baseados em dados de um banco de dados. No entanto, como se vê, nem todo RAG é igual, e otimizar um banco de dados para os melhores resultados possíveis pode ser desafiador.
O fornecedor de banco de dados MongoDB não é estranho ao mundo da IA ou RAG. O banco de dados homônimo da empresa já está sendo usado para RAG, e a MongoDB também lançou iniciativas de desenvolvimento de aplicativos de IA . Embora a empresa e seus usuários — como a gigante médica Novo Nordisk — tenham tido sucesso com IA gen, ainda há mais a ser feito.
Em particular, alucinação e precisão continuam sendo um problema que impede algumas organizações de colocar a IA gen em produção. Para esse fim, a MongoDB anunciou hoje a aquisição da Voyage AI , de capital fechado, que desenvolve modelos avançados de incorporação e recuperação. A Voyage levantou US$ 20 milhões em financiamento em outubro de 2024 em uma rodada apoiada pela gigante de dados em nuvem Snowflake. A aquisição trará a expertise da Voyage AI em incorporar geração e reclassificação — componentes críticos para pesquisa e recuperação com tecnologia de IA — diretamente para a plataforma de banco de dados da MongoDB.
“No último ano, e especialmente à medida que as organizações tentavam pensar em como poderiam criar aplicativos com tecnologia de IA, ficou cada vez mais claro que a qualidade e a confiança dos aplicativos que criam, ou a falta delas, estavam se tornando uma das barreiras para a aplicação de IA em casos de uso de missão crítica”, disse o CPO da MongoDB, Sahir Azam, à VentureBeat.
A ideia básica por trás do RAG é que, em vez de simplesmente confiar em uma base de conhecimento de dados treinados, o mecanismo de IA de geração pode obter dados fundamentados de um banco de dados.
Criar um RAG altamente preciso é bem complexo, e ainda há um risco potencial de alucinações — um desafio enfrentado pelo MongoDB e seus usuários. Embora Azam tenha se recusado a fornecer qualquer exemplo específico ou incidente em que o RAG de IA gen falhou com um usuário, ele observou que a precisão é sempre uma preocupação.
Melhorar a precisão e reduzir a alucinação envolve vários passos. O primeiro é melhorar a qualidade da recuperação (o 'R' em RAG).
“Em muitos casos, a qualidade da recuperação não é boa o suficiente”, disse Tengyu Ma, fundador e CEO da Voyage AI, à VentureBeat. “Na etapa de recuperação, se eles não estiverem recuperando informações relevantes, a recuperação não será muito útil, e o modelo de linguagem grande (LLM) alucina porque precisa adivinhar algum contexto.”
Os modelos Voyage AI agora fazem parte do MongoDB ajudam a melhorar o RAG de algumas maneiras importantes:
- Modelos e reclassificadores específicos de domínio: são treinados em grandes quantidades de dados não estruturados de setores verticais específicos, permitindo que eles entendam melhor a terminologia e a semântica desses domínios.
- Personalização e ajuste fino: os usuários podem ajustar o mecanismo de recuperação para conjuntos de dados e casos de uso exclusivos.

O MongoDB não é o primeiro ou único fornecedor a reconhecer a necessidade e o valor de ter uma tecnologia de incorporação e reclassificação altamente otimizada. Afinal, essa é uma das razões pelas quais a Snowflake investiu na Voyage AI e está usando os modelos da empresa.
É importante notar que, mesmo após serem adquiridos pela MongoDB, os modelos da Voyage AI ainda estarão disponíveis para a Snowflake e para outros usuários da Voyage AI. A grande diferença é que a Voyage AI agora será cada vez mais integrada às plataformas de banco de dados da MongoDB.
Integrar diretamente modelos de incorporação avançados em um banco de dados é uma abordagem adotada por outros fornecedores de banco de dados rivais também. Em junho de 2024, a DataStax anunciou sua própria tecnologia RAGStack que combina modelos avançados de incorporação e recuperação.
Azam argumentou que o MongoDB é um pouco diferente, no entanto. Primeiro, é um banco de dados operacional, em oposição a um banco de dados analítico. Além disso, em oposição a apenas fornecer insights e análises, o MongoDB ajuda a impulsionar transações e operações do mundo real. O MongoDB também é o que é conhecido como um “banco de dados de modelo de documento”, que tem uma estrutura diferente de um banco de dados relacional tradicional. Essa estrutura não depende de colunas e tabelas, que não são particularmente boas em representar informações sobre dados não estruturados (um elemento crítico para aplicativos de IA).
“Somos a única tecnologia de banco de dados que combina o gerenciamento de metadados sobre as informações de um cliente, as operações e transações, que são o coração do que está acontecendo no negócio, bem como a base para recuperação — tudo em um único sistema”, disse Azam.
A necessidade de modelos de incorporação e recuperação altamente precisos está sendo ainda mais acelerada pela IA de agente.
“A IA de agente ainda precisa de métodos de recuperação, porque um agente não pode tomar decisões fora do contexto”, disse Ma. “Às vezes, na verdade, múltiplos componentes de recuperação são usados em até mesmo uma decisão.”
Ma observou que a Voyage AI está atualmente trabalhando em modelos específicos que são altamente personalizados para casos de uso de IA agêntica. Ele explicou que a IA agêntica pode usar diferentes tipos de consultas que ainda podem se beneficiar de mais otimização.
À medida que a IA de geração avança cada vez mais para casos de uso operacional, a necessidade de remover o risco de alucinações é claramente primordial. Embora o MongoDB tenha tido sucesso com a IA de geração, Azam espera que a integração da Voyage AI abra novos casos de uso de missão crítica.
“Se agora podemos dizer: 'Ei, podemos dar a você bem mais de 90% de precisão para seus aplicativos, o que hoje pode, em alguns casos, chegar a apenas 30 ou 60% de precisão para os resultados', a abertura se amplia em termos dos tipos de oportunidades às quais as pessoas podem aplicar IA em seus aplicativos de software”, disse Azam.
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós damos a você informações privilegiadas sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para obter o máximo de ROI.
Leia nossa Política de Privacidade
Obrigado por assinar. Confira mais boletins informativos do VB aqui .
Ocorreu um erro.

venturebeat