Hoje o Vitacodex já mostra grupos genéticos de forma bonita e compreensível. O próximo passo não é "jogar mais genética" na tela. É organizar melhor o raciocínio do motor: corrigir as falhas de recuperação, criar camadas de léxicos dedicadas, montar clusters descritivos e só então expandir a base de SNPs — nessa ordem, com critério.
Em vez de só buscar SNPs por similaridade, o Vitacodex passa a combinar lookup estruturado, léxico dedicado, clusters por tema e narrativa final mais coerente.
Antes de qualquer expansão, o motor precisa de um índice de lookup dedicado. Consultas por rsID, gene e categoria hoje retornam 0% de precisão porque o intent router detecta o tipo mas não tem caminho de resposta. É uma tarde de código com impacto imediato.
O léxico funciona como dicionário inteligente — mas precisa enriquecer o BM25, não contaminar o embedding. Texto limpo para semântica, texto rico para busca por palavra. Dois campos, não um.
Em vez de responder SNP por SNP, o modelo agrupa sinais em blocos biológicos legíveis. Cada cluster tem um score calculado a partir dos genótipos do usuário, pesado por confidence_weight. É isso que alimenta o DNA Explorer.
Só depois que lookup, léxico e clusters funcionam faz sentido adicionar mais marcadores. Antes disso, cada SNP novo entra sem garantia de ser encontrado quando precisar. Quantidade sem estrutura é ruído.
Nem todo sinal genético deve virar recomendação forte. O modelo separa primary (confidence ≥ 0.6) de exploratory (hipótese). Isso protege a credibilidade do Vitacodex e melhora o alinhamento com o Clinical Sync.
"Você tem um SNP com associação moderada a X."
"Seu perfil mostra um padrão no cluster de metabolismo energético. Isso sugere atenção maior à resposta a carboidratos e à estabilidade glicêmica."
Menos sensação de relatório técnico fragmentado. Mais sensação de sistema que realmente entende o conjunto e traduz o resultado para uma pessoa normal.
O DNA Explorer passa a mostrar scores reais por cluster. O Clinical Sync cruza exames com clusters ativos, não com rsIDs isolados. O Target recebe sinais por tema, não por marcador.
Corrigir o que está quebrado antes de construir sobre ele. Impacto imediato, baixo custo.
Dicionário inteligente como campo separado — enriquece BM25 sem degradar semântica.
Grupos legíveis com score real. Bridge entre o backend e o DNA Explorer do Vitacodex.
Narrativa por cluster, prioridade semanal e — agora sim — expansão organizada de SNPs.
Comparativo completo com 23andMe, CircleDNA e Nebula Genomics. Feature matrix, forças do conceito Vitacodex e sinais de mercado favoráveis.
Ver análise de mercadoDiagnóstico completo do stack FAISS + BM25. Resultados de avaliação por área clínica, root cause dos gaps e fixes priorizados com código.
Ver análise técnicaCruzamento entre as 4 fases previstas e o que os testes revelam. Onde a ordem está certa, onde está invertida e o que estava faltando.
Ver cruzamentoAdicionar marcadores sobre um sistema de busca com 0% de precisão por rsID só aumenta ruído. A expansão entra na Fase 3, depois da infraestrutura sólida.
Alguns sinais são sólidos (confidence ≥ 0.6), outros são hipóteses exploratórias. O modelo deixa isso visível em dois tiers distintos.
Busca por similaridade é útil para queries livres, mas falha em consultas exatas. Por isso entram lookup index, léxicos dedicados e category alias map.
O pitch do produto é explicar bem. A ciência fica por trás. A interface continua simples, elegante e acessível.