E-commerce: Detección de fraude con IA en tiempo real
El problema: Fraude es tu hemorrhage silenciosa
Plataforma e-commerce típica (€5M GMV/año):
Tasa de fraude: 2-3% (industria promedio) En dinero: €5M × 2.5% = €125K pérdida/año
Pero el costo real es mayor:
| Concepto | Costo |
|---|---|
| Chargebacks directo | €125K |
| Costo de processing chargeback | €30 × 100+ = €3K |
| Bienes enviados a dirección fraudulenta | €50K (COGS perdido) |
| Gestión manual de casos | €20K (staff investigando) |
| Pérdida de customer legales bloqueados | €40K (false positives) |
| Total real | €238K impacto |
El dilema clásico
- Sin filtro: Fraude descontrolado (-€125K)
- Con filtro simple: Bloqueamos muchas compras legales (-€40K en conversiones perdidas)
Necesitas detección inteligente (few false positives, maximum fraud catch)
La solución: Red neuronal + comportamiento
No es validar una tarjeta o IP.
Es análisis multidimensional:
Tarjeta valida? ✓
IP conocida? ✗
Ubicación vs histórico ✗ (NYC ayer, Barcelona hoy)
Dispositivo registrado? ✗ (iPhone 12, pero siempre Samsung)
Patrón de compra ✗ (compra €20 siempre, hoy €800)
Vendedor riesgo alto ✓ (electrónica cara)
Tienda física cercana? ✗ (sin stock local, envío lento)
Account age ✗ (creada hace 1 día)
Email domain ✗ (free email, but no history)
Conclusión: FRAUDE = 9/10 señales rojas
Aprueba si <= 2 señales rojas, rechaza si >= 4.
Caso 1: Marketplace de electrónica
Setup: €10M GMV/año, 50K transacciones/mes, tasa de fraude 3% baseline
Problema: Sistema de reglas simple:
- Tarjeta válida → Aprueба
- Algunos bloqueos (IP extraña, pero muy restrictivo)
- Tasa falsos positivos: 8% (legítimas bloqueadas)
- Tasa falsos negativos: 30% (fraude que pasó)
Implementamos: Modelo de deep learning
Entrenamos con:
- 18 meses de histórico (10K transacciones fraudulentas identificadas)
- 50+ variables por transacción
- Validación cruzada (75% train, 25% test)
Resultados en 3 meses:
| Métrica | Antes | Después | Delta |
|---|---|---|---|
| Fraude detectado | 70% | 99% | +29pp |
| False positives | 8% | 1% | -7pp |
| Conversión legítima | 92% | 98% | +6% = €600K new |
| Chargeback/mes | 125 | 5 | -120 = €97K saved |
| Manual investigation time | 40h/mes | 5h/mes | 7x reduction |
Impacto financiero:
- Fraud saved: €97K
- Conversión recuperada: €600K
- Staff cost: €30K
- Total: €667K impacto
¿Cómo el modelo detectó fraude?
Ejemplo 1: "Compra al instante"
Nuevo customer, crea account + compra €800 en 3 minutos Historial: Email creado hoy, nunca logueó antes Tarjeta: Válida (no rechazada) Ubicación: NYC, pero IP en Rusia Producto: Laptop alta gama (venta rápida en mercado negro)
Señales rojas: 6/10 → RECHAZA automático
Versus ejemplo 2: "Viajero legítimo"
Registrado customer, 5 compras históricas (€50 promedio) Location: Barcelona (históricamente), hoy Madrid Tienda cercana: Existe (9 km) Producto: €100 (within +2x promedio, OK) Tiempo: 8 min en carrito (reflexión, legítimo) Dispositivo: iPhone 11 (en historial)
Señales rojas: 2/10 → APRUEBA automático
Caso 2: Marketplace de lujo (tickets, relojes)
Setup: Alto valor medio (€500-5K por transacción), alto fraude (5% baseline)
Especificidad: Bienes de lujo = alto robo de tarjetas
Implementamos: Modelo especializado en comportamiento de lujo
Variables únicas:
- Precio vs customer LTV (Lifetime Value)
- Producto: ¿Muy buscado en mercado negro? (sí = lujo, relojes, tech)
- Seller reputation (¿vendedor verificado?)
- Timeframe de envío (¿acepta 2-3 días o necesita 24h = urgencia = riesgo?)
- Email verificado + teléfono confirmado (friction = legitimidad)
Resultado:
- Fraude: 5% → 0.8% (90% menos)
- False positives: 3% (vs 8% antes)
- Revenue: €50M → €52M (menos bloques innecesarios)
Caso 3: Subscription/Membership (software)
Setup: SaaS platform con suscripción monthly (€29-299)
Fraud pattern específico:
- Tarjeta stolen, intenta subscribir
- Si pasa, cobra recurring (victim no ve primero cargo por cantidad baja)
- A los 3 meses: Chargeback masivo
Implementamos: Detección de "first charge fraud"
Lógica:
- Nuevo customer suscribiendo = riesgo
- Modelos:
- Corporate email → menor riesgo (compañía paga)
- Free email + USA → medio riesgo
- Free email + Bangladesh + VPN → alto riesgo
- Si score > threshold: Pide verificación (SMS, 3D-Secure)
- Si pasa verificación: 98% legítimo
Resultado:
- Fraude en suscripción: 0.5% → 0.05%
- Conversión: 89% → 87% (pequeño trade-off por seguridad)
- Chargeback rate: 2% → 0.3%
- Net: €50K saved in chargebacks vs €20K lost conversions = €30K net
Variables del modelo (la "magia")
No es una variable. Son 50+:
Sobre la transacción:
- Amount, producto category, timestamp, device type, OS, browser
Sobre la tarjeta:
- Edad (cuándo se registró), país de emisión, tipo (credit/debit), bin risk
Sobre el cliente:
- Edad account, compras previas, velocidad de compra, RFM (recency/frequency/monetary)
Sobre ubicación:
- IP vs histórico, distancia geográfica imposible (NYC→LAX en 30min), VPN detectado
Sobre vendedor:
- Rating, edad, número de reviews, categoría de producto
Sobre patrón:
- ¿Primero es gasto 5x normal?
- ¿Típicamente compra categoría X, ahora Y?
- ¿Velocidad de checkout anormalmente rápida?
Modelo calcula: Probabilidad de fraude (0-100%)
Si >= 70% → Rechaza
Si 50-70% → Solicita verificación extra
Si < 50% → Aprueba
La tecnología (no es rocket science)
Stack real:
# Input: 50 variables
# Model: XGBoost o LightGBM (gradient boosting)
# Training: 18 meses histórico (100K transacciones)
# Inference: < 100ms (decisión en tiempo real)
# Output: score 0-100
Herramientas:
- Python + scikit-learn
- Feature engineering (crear nuevas variables)
- Validación cruzada (evitar overfitting)
- Explainability (saber por qué rechazó)
Costo:
- Desarrollo: €20-30K
- Infraestructura: €500-1K/mes
- Mantenimiento: €5K/año
- Payback: < 2 meses
¿Por qué funciona en E-commerce?
- Alto volumen: 1K+ transacciones/día = datos para entrenar
- Labeled data: Ya sabes qué fue fraude (chargebacks, reportes)
- Variables disponibles: Tarjeta, IP, historial cliente (todo automático)
- Real-time: Decisión < 100ms (al momento del checkout)
- ROI claro: Cada fraude evitado = €100+ saved
Red flags que el modelo detecta
Tu equipo quizá NO VE, pero el modelo sí:
- Velocidad anormalmente rápida: Checkout en 2 min (vs promedio 15 min)
- Ubicación imposible: NYC ayer, Bangkok hoy
- Compra atípica: Cliente que compra €20 siempre, hoy €5K
- Email pattern: @tempmail.com (burner email)
- Envío misterioso: Dirección diferente a billing, país diferente a IP
- Producto + comportamiento: Electrónica cara + primer comprador = risk
Implementación típica (8 semanas)
Semana 1-2: Data gathering
- Extrae 18 meses histórico
- Identifica fraude confirmado (chargebacks)
- Crea base de training (10K+ casos)
Semana 3-4: Feature engineering
- Crea 50+ variables
- Valida correlación con fraude
- Normaliza datos
Semana 5-6: Modelo
- Entrena XGBoost
- Valida con test set
- Optimiza threshold (balance fraud vs false positives)
Semana 7-8: Deploy
- Integración con payment gateway
- A/B testing (10% de transacciones)
- Full rollout
Resultado: Production-ready en 8 semanas
Próximos pasos
Si eres e-commerce o marketplace:
¿Tu tasa de fraude > 1%?
¿Pierdes conversiones por filtros demasiado restrictivos?
¿Procesas 10K+ transacciones/mes?
Tenemos solución.
Solicita auditoría gratuita → (20 min)
Analizamos:
- Tu tasa actual de fraude + false positives
- Datos disponibles para entrenar modelo
- ROI potencial (típicamente €50-300K/año)
- Timeline (8 semanas to production)
P.D.: El marketplace que mencioné (€10M GMV, 3% fraude)?
Hoy tiene 0.5% de fraude.
Aprueba 98% de compras legítimas (vs 92% antes).
€667K de impacto en 3 meses.
¿Tu plataforma está igual de segura?
¿Quieres implementar esto en tu empresa?
Realiza una auditoría gratuita de 15 minutos y descubre el ROI específico para tu situación.
Solicitar auditoría IA gratuita