Sistema de Classificação de Emails¶

Visão Geral¶

O sistema classifica emails em duas categorias principais usando IA e fallback heurístico.

Categorias¶

Productive (Produtivo)¶

Emails que requerem ação ou atenção: - Problemas técnicos e solicitações de suporte - Reuniões e agendamentos - Projetos e atualizações de status - Perguntas e solicitações - Questões relacionadas ao trabalho

Unproductive (Improdutivo)¶

Emails informativos ou sociais: - Parabéns e felicitações - Agradecimentos e elogios - Newsletters e informativos - Convites sociais - Feedback positivo

Métodos de Classificação¶

1. Google Gemini AI (Primário)¶

Modelo Utilizado¶

Modelo: gemini-1.5-flash
Configuração: Temperature 0.7, Top-p 0.95

Prompt de Classificação¶

prompt = f"""
Analise o seguinte email e classifique-o como:
- 'productive' (emails que requerem ação, contêm problemas, perguntas, solicitações, questões técnicas ou assuntos relacionados ao trabalho)
- 'unproductive' (emails de parabéns, notas de agradecimento, boletins informativos, convites, elogios)

Email para analisar:
{full_content}

Regras para classificação:
- Emails sobre reuniões, agendamentos ou disponibilidade devem sempre ser classificados como 'productive'
- Emails com problemas técnicos, solicitações de suporte ou perguntas são 'productive'
- Emails contendo principalmente elogios, parabéns ou conteúdo social são 'unproductive'
- Em caso de dúvida, incline-se para a classificação 'productive'

Responda APENAS com "productive" ou "unproductive" e inclua um valor de confiança de 0-100.
Formato: "classificação|valor_confiança"
"""

2. Sistema Heurístico (Fallback)¶

Usado quando a API Gemini não está disponível ou rate limit é atingido.

Palavras-chave Improdutivas¶

improdutivo_keywords = [
    "parabéns", "feliz", "aniversário", "congratulações",
    "agradecimento", "obrigado", "newsletter", "informativo",
    "convite", "festa", "celebração", "elogio", "satisfação"
]

Palavras-chave Produtivas¶

produtivo_keywords = [
    "suporte", "problema", "erro", "bug", "solicitação", "ajuda",
    "dúvida", "sistema", "atualização", "relatório", "urgente",
    "incidente", "falha", "acesso", "login", "senha", "não funciona"
]

Regras Especiais¶

Emails com "reunião" + "confirmar" → sempre productive
Feedback positivo com "impressionado" + "satisfação" → unproductive

Fluxo de Classificação¶

Fluxo de Classificação

Níveis de Confiança¶

Gemini AI¶

Alta confiança: 85-100% - Classificação clara
Média confiança: 70-84% - Classificação com alguma incerteza
Baixa confiança: 50-69% - Classificação duvidosa

Sistema Heurístico¶

Confiança fixa: 75% - Baseado em palavras-chave

Contextos de Email¶

O sistema detecta diferentes contextos para melhor classificação:

Reuniões¶

Palavras-chave: "reunião", "agenda", "disponibilidade", "confirmar"
Sempre classificado como productive

Suporte Técnico¶

Palavras-chave: "suporte", "problema", "erro", "bug", "falha"
Sempre classificado como productive

Projetos¶

Palavras-chave: "projeto", "atualização", "status", "progresso"
Geralmente classificado como productive

Feedback¶

Palavras-chave: "feedback", "opinião", "satisfação", "experiência"
Classificação baseada no tom (positivo/negativo)

Estatísticas de Desempenho¶

O sistema mantém estatísticas de: - Taxa de uso da API Gemini vs Heurística - Distribuição de níveis de confiança - Tempo médio de processamento - Rate limiting e fallbacks