Esse artigo é o lado prático de Base de conhecimento (RAG) — focado em como você, na prática, alimenta o agente com arquivos pra que ele responda bem. Sem técnicas. Só receitas que funcionam.
Pré-requisitos
Agente de IA criado.
Arquivos relevantes do seu negócio (catálogo, FAQ, manuais).
O que subir — guia por tipo de negócio
E-commerce / Loja virtual
Suba:
Catálogo de produtos (PDF ou planilha CSV) com nome, descrição, preço, foto.
Política de troca / devolução (PDF do site).
FAQ comum: prazo de entrega, formas de pagamento, garantia.
Termos de uso / Privacidade (PDF).
Resultado: agente sabe responder "Quanto custa o produto X?", "Vocês entregam pra Maceió?", "Posso trocar?".
Serviços (Imobiliária, Advocacia, Consultoria)
Suba:
Lista de serviços com escopo + valor + prazo.
Cases de sucesso (estudos curtos, 1-2 páginas cada).
Perfis de profissionais (especialidades de cada advogado, consultor).
Política de honorários / forma de cobrança.
Resultado: agente sabe falar "Vocês fazem inventário?", "Tem advogado especialista em trabalhista?", "Quanto custa consulta?".
Saúde (Clínicas, Médicos, Dentistas)
Suba:
Lista de procedimentos com descrição (sem valores se sigilo).
Convênios aceitos.
Horários de atendimento por especialidade.
Política de remarcação / cancelamento.
Endereços e contatos.
⚠️ Atenção: cuidado com dados sensíveis (LGPD). Não suba prontuários, dados pessoais de pacientes — só info institucional.
Resultado: agente responde "Atendem Unimed?", "Tem cardiologista hoje?", "Endereço da clínica?".
SaaS / Tech
Suba:
Documentação técnica (manual do produto).
Pricing (tabela de planos com features).
Changelog (releases recentes).
FAQ técnico (troubleshooting comum).
Resultado: agente responde "Como integro com Zapier?", "Plano Growth inclui webhooks?", "Versão atual tem suporte a TypeScript?".
Educação (Cursos, Escolas)
Suba:
Grade curricular dos cursos.
Calendário acadêmico (datas de provas, recessos).
Política de mensalidade / bolsas.
Perfis de professores.
Resultado: agente responde "Quando começa o curso de inglês?", "Tem desconto pra família?", "Quem é o professor de matemática?".
Estrutura ideal dos arquivos
PDF / Word
Use headings claros e listas:
# Catálogo de Produtos
## Categoria: Eletrônicos
### iPhone 15 Pro
- Preço: R$ 8.999
- Cores: Preto, Branco, Azul
- Garantia: 12 meses Apple
- Estoque: Disponível
### Samsung Galaxy S24
...
Sistema captura bem essa estrutura. Listas viram chunks coerentes.
TXT
Use separação clara:
PRODUTO: iPhone 15 Pro
PRECO: R$ 8.999
CORES: Preto, Branco, Azul
ESTOQUE: 12 unidades
PRODUTO: Samsung Galaxy S24
PRECO: R$ 6.499
...
CSV
Bom pra dados estruturados:
nome,preco,categoria,estoque
iPhone 15 Pro,8999,Eletrônicos,12
Samsung Galaxy S24,6499,Eletrônicos,8
...
💡 Dica: pra agente entender CSV, inclua header descritivo na linha 1. Se possível, converta pra texto explicativo ao invés de tabela bruta.
Boas práticas
1. Linguagem natural, como cliente fala
Cliente perguntará: "Quanto custa o iPhone?". Seu arquivo deve ter algo tipo "O iPhone 15 Pro custa R$ 8.999" — não só "iPhone 15 Growth: 8999".
A busca semântica funciona melhor com linguagem natural do que com tabelas codificadas.
2. Inclua sinônimos
Se você vende frete, inclua também "entrega", "envio", "despacho". Se vende mensalidade, inclua "plano", "assinatura", "valor mensal".
"O frete pra capitais é R$ 25 e leva 2-3 dias úteis."
"Para envio pra capitais, cobramos R$ 25..."
"A entrega expressa custa R$ 50..."
3. Cobertura completa
Liste todas as variações importantes:
Plano A, B, C — não só A.
Cidades atendidas — todas, não só "principais".
Horários por dia — "Segunda 9h-18h, Terça 9h-18h...".
Se um cliente perguntar sobre algo que não está, agente vai dizer "não tenho essa informação".
4. Atualize regularmente
Mensalmente: revise preços, estoque, promoções vencidas.
A cada lançamento: atualize catálogo / serviços novos.
Quando políticas mudam: imediato (ex: nova política de troca).
Agente respondendo com info defasada é pior que respondendo "não sei".
5. Arquivos focados
Em vez de 1 arquivo gigante com tudo, divida em:
catalogo-produtos.pdfpoliticas.pdffaq.pdfcases.pdf
RAG escolhe melhor o chunk relevante quando arquivos têm escopos claros.
Subir o primeiro arquivo
Acesse
/ia/agentes/{id}/editar.Localize a seção Base de Conhecimento.
Use a dropzone ou clique pra selecionar.
Escolha o arquivo no computador.
Aguarde o processamento (poucos segundos a 1 min pra arquivos grandes).
Status muda pra ✓ Pronto com count de chunks indexados.
Testar imediatamente
Após subir:
Abra chat de teste (lateral na página de edição).
Faça perguntas sobre o conteúdo do arquivo.
Verifique se o agente:
Responde corretamente baseado no arquivo.
Cita o conteúdo certo (sem inventar).
Se errar, ajuste:
Estrutura do arquivo (headings mais claros).
Linguagem (mais natural).
Granularidade (chunks pequenos vs grandes).
Casos de uso reais
Caso 1 — Restaurante delivery
Arquivo: cardapio-completo.pdf com pratos, ingredientes, preços, fotos descritas.
Cliente: "Vocês têm pizza de calabresa?"
Agente busca chunks → encontra: "Pizza de Calabresa: R$ 49 (média) / R$ 65 (grande). Ingredientes: molho de tomate caseiro, mussarela, calabresa fatiada, cebola e azeitona."
Responde: "Sim! A pizza de calabresa custa R$ 49 (média) ou R$ 65 (grande). Vai de molho caseiro, mussarela, cebola e azeitona. Quer pedir?"
Caso 2 — Imobiliária locação
Arquivos: imoveis-disponiveis.pdf (atualizado semanalmente), politica-locacao.pdf.
Cliente: "Tem apartamento de 2 quartos no Morumbi até R$ 3.000?"
Agente busca → encontra match: "Apto 2 dorms, Morumbi, 65m², R$ 2.800 + condomínio R$ 850. Garagem 1 vaga."
Responde com opção específica. Se não tem match: "No momento, não tenho apartamento exatamente com essas características. Mas posso te avisar quando aparecer? Ou ver opções similares?"
Caso 3 — Curso online
Arquivo: grade-curricular-cursos.pdf + pricing.pdf.
Cliente: "O curso de Excel inclui PowerBI?"
Agente: "Não, o curso de Excel cobre formulas avançadas, tabelas dinâmicas e VBA. PowerBI é um curso separado. Quer info dos dois?"
Erros comuns
"Agente responde com info errada apesar de eu ter subido o arquivo"
Causa: chunk relevante não foi pego (similaridade baixa).
Solução:
Reescreva o conteúdo com linguagem mais próxima da pergunta do cliente.
Adicione palavras-chave (sinônimos).
Verifique se o arquivo foi indexado (status ✓).
"Agente diz 'não tenho essa informação' mas eu tenho!"
Causa: similaridade abaixo de threshold (0.25).
Solução:
Pergunta do cliente é muito vaga? Reformule conteúdo pra cobrir.
Conteúdo está em chunks longos? Reduza tamanho do arquivo (split em vários menores).
"Agente inventa coisas sobre meu negócio"
Causa: alucinação do LLM por falta de contexto na base.
Solução:
Adicione regras explícitas no campo "Comportamento esperado": "Se você não tem certeza, diga que não tem a informação. Não invente."
Aumente a base com mais detalhes.
"Imagem foi indexada mas descrição está errada"
Causa: LLM Vision teve dificuldade com a imagem.
Solução:
Substitua a imagem por versão de melhor qualidade.
Ou delete a imagem e adicione descrição manual no textarea.
Quanto subir? Existe limite?
Não há limite formal. Mas:
Arquivos individuais: máx 20 MB.
Total de chunks por agente: ilimitado, mas centenas de milhares pode degradar busca.
Custo de chat: depende do volume — chunks são selecionados (top 5), não vão todos no prompt.
Pra a maioria dos casos, 5-20 arquivos cobrem 95% das perguntas.
Resumo prático
Identifique principais perguntas dos clientes.
Crie arquivos respondendo com linguagem natural.
Subir, testar, ajustar, repetir.
Atualize quando muda (preços, políticas, lançamentos).
Combine texto livre + arquivos pra cobertura total.
Próximos passos
Pra entender tools que o agente executa, veja Tools do agente.
Pra ajustar comportamento via persona, veja Criar agente IA.