[ Missão ]

Cibersegurança ofensiva precisa operar na velocidade dos ataques modernos.

Adversários já operam com IA. Construímos HackerSec.ai para que a defesa opere na mesma velocidade, com a profundidade técnica que só especialistas humanos garantem.

[ Quem somos ]

Construído sobre uma década de pesquisa ofensiva.

Iniciativa de pesquisa e produto da HackerSec, referência em cibersegurança ofensiva no mercado brasileiro. HackerSec.ai reúne três frentes que evoluíram em paralelo ao longo dos últimos anos.

HackerSec

A organização

Fundada em 2011
+500 empresas atendidas
Referência em cibersegurança ofensiva no Brasil
Pioneira em metodologia AI-First
Atuação nacional e internacional

Yaga

O agente

+1000 cenários de exploração
98% de acurácia em 600 testes
91.2% em cadeias de exploração
Compatível com 20+ modelos backbone
Documentada em paper técnico

HAS

A plataforma

Plataforma proprietária da HackerSec
Integrações nativas (Jira, Slack, MCP)
Em produção 24/7
Acompanhamento em tempo real
Reteste em 1 clique

[ A metodologia proprietária ]

Pentest AI-First.

Inteligência artificial real acelerando o processo. Especialistas humanos aprofundando o ataque. Quatro etapas para entregar pentests mais próximos do comportamento de adversários reais.

Etapa 01

Definição de escopo

Superfície de ataque e objetivos definidos. IA e pentesters atuam onde importa.

→

Etapa 02

IA realiza o pentest

Reconhecimento, explorações reais, análise contextual e identificação de vulnerabilidades.

→

Etapa 03

Validação especializada

Cada achado passa por critérios técnicos. Apenas vulnerabilidades confirmadas avançam.

→

Etapa 04

Aprofundamento humano

Pentesters exploram cadeias de ataque, lógica de negócio e cenários complexos.

"O futuro do pentest não é automação total. É inteligência artificial acelerando o processo e especialistas aprofundando o ataque."
Andrew Martinez, CEO da HackerSec

[ O agente ]

Yaga

Agente autônomo de pentest desenvolvido internamente pela HackerSec. Arquitetura exploitation-first em quatro camadas: Intelligence Layer, Execution Layer, Chain Engine e Memory System.

Conta com agentes especializados sobre mais de 1000 cenários de exploração: injeção, autenticação, lógica de negócio, escalada de privilégio, lateral movement e cadeias multi-vetor. Toolchains com 140+ instrumentos complementam a execução.

Compatível com mais de 20 modelos backbone, incluindo frontier (GPT-5.5, GPT-5, Claude Opus 4.7/4.6, Qwen 72B, Llama 3.2) e modelos customizados treinados pela HackerSec. Atua sobre web, APIs, redes, cloud, mobile, IoT e sistemas com IA/LLM, em modos white-box, gray-box e black-box.

01

Reconhecimento e navegação. Mapeia a superfície de ataque, percorre a aplicação como usuário e enumera endpoints, parâmetros e fluxos de autenticação.

02

Compreensão e análise de arquitetura. Identifica stack tecnológico, padrões de design e pontos de entrada críticos. Extrai insumos relevantes para os testes (tokens, headers, payloads e estados internos).

03

Exploração real. Executa exploits dentro do escopo autorizado, testa lógica de negócio e encadeia vulnerabilidades para validar impacto operacional.

04

Refinamento contextual. Adapta a execução ao ambiente, prioriza o que importa e descarta sinais inconsistentes antes da validação humana.

[ Posicionamento metodológico ]

Profundidade técnica em tempo de máquina.

Diferença operacional entre as três abordagens disponíveis hoje no mercado para identificação de vulnerabilidades.

Scan automatizado

Pentest tradicional

HackerSec.ai

Cobertura da superfície

Vulns conhecidas

Amostral

Total

Tempo de execução

Minutos

2 a 4 semanas

Horas

Exploração real

Sinais conhecidos

Sim

Lógica de negócio

n/a

Sim

Validação humana

n/a

Sim

Falsos positivos entregues

Altos

Baixos

Zero

Escalabilidade

Alta

Limitada

Alta

Comparação baseada em metodologias operadas em ambientes de produção, sob escopo definido. Validação humana realizada por pentesters especialistas da HackerSec.

[ Em produção ]

Yaga, em números.

92.3%

Precisión general en 124 escenarios del benchmark académico (black-box, gray-box y white-box) con Claude Opus 4.8.

91.2%

Precisión en cadenas de explotación multi-etapa con Opus 4.8. RCE, SSRF encadenado, escalación de privilegios y movimiento lateral.

3.2%

Tasa de falsos positivos del agente aislado en escenarios black-box. La validación humana posterior eleva el finding entregado a cero falsos positivos.

[ Comparação com sistemas autônomos publicados ]

Yaga vs. agentes publicamente avaliados.

Avaliamos a Yaga sobre 600 cenários do nosso benchmark proprietário, abrangendo OWASP TOP 10 Web, API, LLM, Mobile e infraestrutura GOAD (Active Directory).

PentAGI

Strix

Shannon

Yaga

Acurácia geral de detecção

~67%

~70%

~72%

98.0%

Cadeia de exploração (média ponderada)

52.0%

55.4%

58.1%

91.2%

Captura de flag (CTF, 120 cenários)

70.0%

72.5%

74.2%

96.3%

Bypass de autenticação (85 cenários)

~60%

~67%

~65%

94.7%

Taxa de falsos positivos (agente isolado)

~16%

~13%

~14%

2.0%

Avaliação sobre o benchmark proprietário da HackerSec (600 cenários OWASP TOP 10 Web, API, LLM, Mobile e infraestrutura GOAD). Sistemas comparados: PentAGI (github.com/vxcontrol/pentagi), Strix (github.com/usestrix/strix), Shannon (github.com/KeygraphHQ/shannon).

Métricas aplicáveis ao agente operando isoladamente. Em produção, achados da Yaga passam por validação humana especializada antes de qualquer entrega ao cliente, eliminando os 2% de falsos positivos residuais.

[ Benchmark sobre modelos atuais ]

Como a Yaga se sai em modelos de frontier.

Evaluamos Yaga sobre los principales modelos de lenguaje de frontier, en los tres modos de pentest (white-box, gray-box y black-box), sobre los 124 escenarios del benchmark académico — de los cuales 40 requieren cadenas de explotación multi-etapa.

Modelo backbone

White-box

Gray-box

Black-box

Tiempo medio

Especialidad

Claude Opus 4.8
96.1%
93.8%
87.4%
18.3 min
Cima en cadenas complejas. Mejor calibración bajo incertidumbre.

GPT-5.5

94.2%

89.7%

83.1%

22.7 min

Fuerte en cadenas cortas. Pierde tracción en 5+ etapas.

Claude Opus 4.7

91.8%

86.1%

80.2%

23.5 min

Mejor en contextos white-box con información rica.

Claude Opus 4.6

91.3%

87.5%

79.8%

24.1 min

Calibración de incertidumbre superior en gray-box.

Claude Sonnet 4.6

85.5%

78.9%

71.4%

31.2 min

Costo-eficiente. Degrada en cadenas largas.

Modelos evaluados bajo condiciones estrictamente idénticas: misma versión del framework Yaga, mismo inventario de herramientas, mismos templates de prompt y mismos targets. Tiempo medio por escenario del benchmark.

[ A plataforma ]

HAS. Onde tudo se integra.

Plataforma proprietária da HackerSec onde a Yaga opera e os pentesters humanos validam. Cliente acompanha em tempo real, gerencia correções, solicita retestes e integra com as ferramentas que a equipe já usa.

Solicitação em minutos

Define escopo e dispara pentest direto na plataforma.

Acompanhamento em tempo real

Vulnerabilidades aparecem conforme são identificadas.

Findings completos

CVSS, evidências de exploração e recomendações de correção.

Reteste com 1 clique

Cliente corrige, solicita revisão e valida o fechamento.

Integrações de fluxo

Jira, Slack, Teams, GitHub e ServiceNow nativos.

Conexão MCP

Agentes de IA do cliente consultam dados de segurança diretamente.

[ Colaboración ]

Construida para crecer con el ecosistema.

La iniciativa HackerSec.ai está abierta a la colaboración con empresas de ciberseguridad asociadas a HackerSec. Quienes operan en el mismo terreno tienen acceso anticipado a nuevos módulos de la plataforma HAS, proponen escenarios de evaluación para Yaga y evolucionan junto con la metodología Pentest AI-First.

Hablar sobre asociación

Construindo a próxima geração de cibersegurança ofensiva.

Cibersegurança ofensiva precisa operar na velocidade dos ataques modernos.

Construído sobre uma década de pesquisa ofensiva.

HackerSec

A organização

Yaga

O agente

HAS

A plataforma

Pentest AI-First.

Definição de escopo

IA realiza o pentest

Validação especializada

Aprofundamento humano

Yaga

Profundidade técnica em tempo de máquina.

Yaga, em números.

Yaga vs. agentes publicamente avaliados.

Como a Yaga se sai em modelos de frontier.

HAS. Onde tudo se integra.

Solicitação em minutos

Acompanhamento em tempo real

Findings completos

Reteste com 1 clique

Integrações de fluxo

Conexão MCP

Construida para crecer con el ecosistema.

A próxima geração de cibersegurança ofensiva.