132 lines
5.5 KiB
Python
132 lines
5.5 KiB
Python
import os
|
|
import re
|
|
import requests
|
|
import json
|
|
from tools import AVAILABLE_TOOLS
|
|
from config import get_config
|
|
|
|
def get_llm_response(prompt: str, provider: str, cfg: dict) -> str:
|
|
"""Invoca o provedor de LLM configurado."""
|
|
if provider == "gemini":
|
|
api_key = cfg.get("gemini_api_key") or os.getenv("GEMINI_API_KEY")
|
|
url = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent?key={api_key}"
|
|
payload = {"contents": [{"parts": [{"text": prompt}]}]}
|
|
res = requests.post(url, json=payload)
|
|
if res.status_code == 200:
|
|
return res.json()["candidates"][0]["content"]["parts"][0]["text"]
|
|
return f"Erro Gemini: {res.text}"
|
|
|
|
elif provider == "ollama":
|
|
ollama_host = os.getenv("OLLAMA_HOST", "http://ollama-lw4s8g4gc8gss4gkc4gg0wk4:11434")
|
|
res = requests.post(f"{ollama_host}/api/generate", json={
|
|
"model": os.getenv("OLLAMA_MODEL", "qwen2.5-coder:1.5b"),
|
|
"prompt": prompt,
|
|
"stream": False
|
|
})
|
|
if res.status_code == 200:
|
|
return res.json().get("response", "")
|
|
return f"Erro Ollama: {res.text}"
|
|
|
|
return "Provedor desconhecido."
|
|
|
|
def query_agent(prompt: str, override_provider: str = None, chat_history: list = None) -> str:
|
|
"""
|
|
Motor Agente em Loop (ReAct): Pensamento -> Ação -> Observação -> Resposta Final.
|
|
"""
|
|
cfg = get_config()
|
|
provider = override_provider or cfg.get("active_provider", "gemini")
|
|
|
|
# Contexto de Ferramentas para a IA
|
|
tools_desc = "\n".join([f"- {k}: {v['description']}" for k,v in AVAILABLE_TOOLS.items()])
|
|
|
|
# Prompt especializado reformulado para evitar alucinações
|
|
system_prompt_base = """Você é o [Antigravity VPS Agent], o SysAdmin de elite do Marcos.
|
|
Você tem acesso root completo à VPS e deve agir de forma profissional e precisa.
|
|
|
|
### REGRAS DE OURO:
|
|
1. Responda em PORTUGUÊS (Brasil).
|
|
2. Se o usuário pedir o status da VPS, SEMPRE use a ferramenta 'get_system_health'.
|
|
3. Se o usuário pedir algo sobre containers, use 'get_docker_stats'.
|
|
4. Antes de decidir que um arquivo não existe, use 'run_bash_command' com 'ls' para verificar o diretório.
|
|
5. NUCA invente que buscou por arquivos (como syslog.conf) se o usuário não pediu especificamente por eles.
|
|
6. A seção <REFINED> deve conter apenas as informações solicitadas. Se não houver imagem relevante, não inclua tags de imagem.
|
|
7. O disco da VPS está montado em `/host_root`. Quando for procurar arquivos no sistema, use `/host_root` como base e redirecione erros (ex: `find /host_root -name 'nome' 2>/dev/null`).
|
|
|
|
### FORMATO DE AÇÃO:
|
|
Use: [TOOL:nome_da_ferramenta] argumento [/TOOL]
|
|
Rode UMA ferramenta por vez. Aguarde a saída do SISTEMA antes de concluir.
|
|
|
|
### RESPOSTA FINAL:
|
|
Sua resposta terminada deve ter:
|
|
- Um resumo técnico.
|
|
- Uma seção <REFINED> ... </REFINED> com Markdown limpo.
|
|
- **DICA**: Só use imagens em <REFINED> se o usuário pediu para ver um arquivo de imagem específico que você localizou. Use o caminho absoluto encontrado.
|
|
|
|
### FERRAMENTAS DISPONÍVEIS:
|
|
{TOOLS_LIST}
|
|
|
|
### EXEMPLO DE SUCESSO:
|
|
Usuário: qual o uso de ram agora?
|
|
Agente: [TOOL:get_system_health] [/TOOL]
|
|
SISTEMA: CPU: 5% | RAM Usada: 20% | Disco Usado: 40%
|
|
Resposta: A memória RAM está operando com 20% de uso.
|
|
<REFINED>
|
|
### 📊 Memória e CPU
|
|
- **RAM Utilizada**: 20%
|
|
- **CPU**: 5%
|
|
</REFINED>
|
|
"""
|
|
system_prompt = system_prompt_base.replace("{TOOLS_LIST}", tools_desc)
|
|
|
|
# Constrói o histórico da conversa (memória de curto prazo)
|
|
history_str = ""
|
|
if chat_history:
|
|
for msg in chat_history[-5:]: # Pega as últimas 5 interações
|
|
history_str += f"\nUsuário: {msg['user']}\nAgente: {msg['bot']}\n"
|
|
|
|
history_str += f"\nUsuário: {prompt}\n"
|
|
|
|
current_iteration_history = history_str
|
|
max_loops = 12
|
|
|
|
print(f"--- INICIANDO AGENTE ({provider}) ---")
|
|
|
|
for i in range(max_loops):
|
|
print(f"\n[LOOP {i+1}/{max_loops}]")
|
|
full_prompt = system_prompt + current_iteration_history
|
|
response = get_llm_response(full_prompt, provider, cfg)
|
|
|
|
print(f"PENSAMENTO:\n{response}")
|
|
|
|
# Procura por chamadas de ferramentas na resposta
|
|
match = re.search(r"\[TOOL:(.*?)\](.*?)\[/TOOL\]", response, re.IGNORECASE | re.DOTALL)
|
|
|
|
if match:
|
|
tool_name = match.group(1).strip()
|
|
arg = match.group(2).strip()
|
|
|
|
print(f"EXECUTANDO: {tool_name} | ARGS: {arg}")
|
|
|
|
if tool_name in AVAILABLE_TOOLS:
|
|
func = AVAILABLE_TOOLS[tool_name]["func"]
|
|
# Caso a ferramenta não aceite argumentos (ex: get_system_health)
|
|
if tool_name in ["get_system_health", "get_docker_stats"]:
|
|
observation = func()
|
|
else:
|
|
observation = func(arg)
|
|
|
|
print(f"OBSERVAÇÃO (suprimida): {str(observation)[:200]}...")
|
|
else:
|
|
observation = f"Erro: Ferramenta '{tool_name}' não encontrada."
|
|
print(f"ERRO: {observation}")
|
|
|
|
# Adiciona ao histórico do loop atual
|
|
current_iteration_history += f"\nAgente (Ação): {response}\nSISTEMA (Saída de {tool_name}): {observation}\n"
|
|
else:
|
|
# Se não tem comando, é a resposta final
|
|
print("--- RESPOSTA FINAL ENCONTRADA ---")
|
|
return response
|
|
|
|
print("!!! ERRO: LIMITE DE TENTATIVAS ATINGIDO !!!")
|
|
return "O agente atingiu o limite de tentativas para esta tarefa."
|