Skip to content

Sistema de Classificação de Emails

Visão Geral

O sistema classifica emails em duas categorias principais usando IA e fallback heurístico.

Categorias

Productive (Produtivo)

Emails que requerem ação ou atenção: - Problemas técnicos e solicitações de suporte - Reuniões e agendamentos - Projetos e atualizações de status - Perguntas e solicitações - Questões relacionadas ao trabalho

Unproductive (Improdutivo)

Emails informativos ou sociais: - Parabéns e felicitações - Agradecimentos e elogios - Newsletters e informativos - Convites sociais - Feedback positivo

Métodos de Classificação

1. Google Gemini AI (Primário)

Modelo Utilizado

  • Modelo: gemini-1.5-flash
  • Configuração: Temperature 0.7, Top-p 0.95

Prompt de Classificação

prompt = f"""
Analise o seguinte email e classifique-o como:
- 'productive' (emails que requerem ação, contêm problemas, perguntas, solicitações, questões técnicas ou assuntos relacionados ao trabalho)
- 'unproductive' (emails de parabéns, notas de agradecimento, boletins informativos, convites, elogios)

Email para analisar:
{full_content}

Regras para classificação:
- Emails sobre reuniões, agendamentos ou disponibilidade devem sempre ser classificados como 'productive'
- Emails com problemas técnicos, solicitações de suporte ou perguntas são 'productive'
- Emails contendo principalmente elogios, parabéns ou conteúdo social são 'unproductive'
- Em caso de dúvida, incline-se para a classificação 'productive'

Responda APENAS com "productive" ou "unproductive" e inclua um valor de confiança de 0-100.
Formato: "classificação|valor_confiança"
"""

2. Sistema Heurístico (Fallback)

Usado quando a API Gemini não está disponível ou rate limit é atingido.

Palavras-chave Improdutivas

improdutivo_keywords = [
    "parabéns", "feliz", "aniversário", "congratulações",
    "agradecimento", "obrigado", "newsletter", "informativo",
    "convite", "festa", "celebração", "elogio", "satisfação"
]

Palavras-chave Produtivas

produtivo_keywords = [
    "suporte", "problema", "erro", "bug", "solicitação", "ajuda",
    "dúvida", "sistema", "atualização", "relatório", "urgente",
    "incidente", "falha", "acesso", "login", "senha", "não funciona"
]

Regras Especiais

  • Emails com "reunião" + "confirmar" → sempre productive
  • Feedback positivo com "impressionado" + "satisfação" → unproductive

Fluxo de Classificação

Fluxo de Classificação

Níveis de Confiança

Gemini AI

  • Alta confiança: 85-100% - Classificação clara
  • Média confiança: 70-84% - Classificação com alguma incerteza
  • Baixa confiança: 50-69% - Classificação duvidosa

Sistema Heurístico

  • Confiança fixa: 75% - Baseado em palavras-chave

Contextos de Email

O sistema detecta diferentes contextos para melhor classificação:

Reuniões

  • Palavras-chave: "reunião", "agenda", "disponibilidade", "confirmar"
  • Sempre classificado como productive

Suporte Técnico

  • Palavras-chave: "suporte", "problema", "erro", "bug", "falha"
  • Sempre classificado como productive

Projetos

  • Palavras-chave: "projeto", "atualização", "status", "progresso"
  • Geralmente classificado como productive

Feedback

  • Palavras-chave: "feedback", "opinião", "satisfação", "experiência"
  • Classificação baseada no tom (positivo/negativo)

Estatísticas de Desempenho

O sistema mantém estatísticas de: - Taxa de uso da API Gemini vs Heurística - Distribuição de níveis de confiança - Tempo médio de processamento - Rate limiting e fallbacks