Por qué el fraude con tarjeta no presente (CNP) es una amenaza en constante evolución para las empresas de comercio electrónico

CNP fraud is a significant concern faced by eCommerce merchants. And just as you may feel you have it under control, it evolves, and new risks emerge. By 2023 eCommerce merchants are projected to lose $130B to fraud. Unfortunately, the steps that many merchants have taken to control fraud end up costing them more than their direct fraud losses. False positives, declining a legitimate order due to the suspicion of fraud, cost merchants $118B in an average year.

Los desafíos son importantes

Finalizar la compra

Merchants are facing an uphill challenge when it comes to CNP Fraud. While they recognize the risks and have put solutions in place to fight fraud, they are often falling short of the desired result. There is a huge financial impact associated with false declines. That’s revenue merchants are leaving on the table. And the customers they decline will frequently explore other options the next time they go shopping. Merchants may also be facing a high rate of fraud chargebacks. They know they’re taking on too much but their efforts to control the problem aren’t working. Rule-based fraud strategies always seem to be one step behind criminals. Fraud control system and chargeback management costs are going through the roof, with very little to show for it. Developing accurate and timely detection methods is essential but difficult.

Un sistema efectivo de control del fraude debe hacer lo siguiente:

  • Abordar los comportamientos fraudulentos diversos y ocultos
  • Reconocer los patrones cambiantes de fraude
  • Proporcionar retroalimentación de manera oportuna
  • Adaptarse con rapidez y precisión a las amenazas emergentes
  • Reducir en gran medida los falsos positivos

 

¿Cuál es la diferencia entre

los sistemas de control del fraude proactivos y reactivos?

 

La mayoría de los sistemas de control del fraude comienzan con la detección proactiva basada en reglas. Estas herramientas tienen importantes limitaciones. Solo pueden detectar patrones de fraude sencillos que se basan en una cantidad limitada de atributos o variables. Requieren una gran cantidad de esfuerzo manual para definir y codificar cada regla. Una vez que se ponen en funcionamiento, estos sistemas suelen ser lentos para responder debido a que el procesamiento es excesivamente pesado.

Los sistemas de control del fraude reactivos que se basan en la inteligencia artificial (AI) y el aprendizaje automático (ML) son superiores al enfoque proactivo basado en reglas. Ofrecen una detección muy superior de patrones complejos y correlaciones no lineales. Pueden manejar cientos de atributos en lugar de unos pocos y son capaces de analizar grandes cantidades de datos y de responder con mayor rapidez. Uno de los principales beneficios de los sistemas de AI/ML es su capacidad de aprender una amplia gama de patrones de fraude y de desarrollar y entrenar nuevos modelos automáticamente. Los nuevos modelos candidatos se desarrollan en la canalización de ML, se comprueba su eficacia y, una vez comprobada, se implementan en la producción.

 

 

Por qué el aprendizaje automático no es una solución milagrosa

intgration-1At this point, a merchant might jump to the false conclusion that an advanced machine learning system will solve every fraud challenge. On its own, that simply isn’t the case.

Los sistemas de IA/ML tienen varias dependencias y pueden fallar por muchas razones.

  1. La ingeniería de funciones llevada a cabo por expertos es clave para el rendimiento del sistema. La experiencia en la materia es fundamental para perfeccionar y optimizar los modelos.
  2. La calidad de los datos determina el límite superior del rendimiento del modelo. El dicho "basura entra, basura sale" es particularmente válido cuando se analiza la eficacia de cualquier sistema de IA/ML. Sin el acceso a los datos del consorcio y al intercambio colaborativo de datos, la visión y la precisión de un modelo son limitadas.
  3. Cada algoritmo apunta a una amenaza específica. De manera aislada, un modelo nunca será adecuado. Es fundamental aplicar una estrategia cohesiva que proporcione una cobertura organizada.
  4. La inteligencia artificial y el aprendizaje automático no son soluciones independientes y no se debe esperar que actúen como tales. Los sistemas líderes de fraude aprovechan una amplia gama de tecnologías, entre las que se incluyen las siguientes:
    • AI/ML
    • Datos del consorcio
    • Análisis de vínculos gráficos
    • Autenticación avanzada de la identidad
    • Espera silenciosa
    • Y mucho más…

 

How Vesta’s Approach to CNP Fraud Prevention is Different

response-1

Nuestra meta es aumentar las ganancias

para las empresas

Aplicamos un enfoque de varios niveles para prevenir el fraude a través de lo siguiente:
  • Análisis de datos sobre el comportamiento y los dispositivos
    • En general, Vesta utiliza más de 200 millones de activos de datos únicos. Entre estos datos, se incluyen los datos de terceros, de redes sociales, correos electrónicos, teléfonos, huellas digitales y mucho más.
  • Políticas
    • Las políticas son un filtro de primer nivel para detener el fraude evidente y se pueden utilizar para eliminar los valores anormales fáciles de detectar.
  • Machine Learning
    Vesta advanced machine learning includes numerous technologies such as
    • Análisis de vínculos gráficos
    • Técnicas de conjuntos
    • Aprendizaje supervisado
    • Detección de anomalías y alertas de fraude
  • Factor humano
    • La revisión realizada por los analistas de fraude es una parte importante de un sistema eficaz de control del fraude. Cabe aclarar que no es lo mismo que la revisión manual. Los analistas de fraude son científicos de datos capacitados con títulos avanzados en matemáticas, estadística y análisis de datos que utilizan su experiencia para perfeccionar los modelos a fin de lograr un rendimiento óptimo.
    • La demora en la toma de decisiones mediante la espera silenciosa permite demorar la decisión final sobre el fraude mientras se reúnen y evalúan otros datos.
    • Puede utilizarse una autenticación secundaria, como el redireccionamiento a 3DS si se requieren más autenticaciones para validar la legitimidad de una transacción.

Los pilares fundamentales de la estrategia de aprendizaje automático de Vesta son los siguientes:

  • Aprendizaje automático supervisado
    • Esta es la técnica más común utilizada en nuestro portafolio de aprendizaje automático. Los modelos se entrenan con miles de millones de transacciones etiquetadas como legítimas o fraudulentas. Se perfeccionan a través de un ciclo de aprendizaje repetitivo en el que se realizan predicciones en tiempo real y los resultados se utilizan para seguir alimentando el proceso de entrenamiento.
  • Aprendizaje automático no supervisado
    • En los casos en los que los datos de las transacciones etiquetadas no están disponibles o son muy limitados, se pueden utilizar modelos de autoaprendizaje. Estos sistemas están diseñados para detectar comportamientos anómalos mediante la detección de patrones únicos fuera de los niveles. Se incorporan las recomendaciones para perfeccionar los nuevos modelos candidatos que se evalúan antes de implementarlos en la producción.
  • Aprendizaje automático adaptativo
    • El aprendizaje automático adaptativo gestiona la evolución de los patrones de fraude a través de un proceso de actualizaciones continuas basadas en la retroalimentación sobre el fraude.
  • Análisis de vínculos gráficos en tiempo real
    • Esta técnica se utiliza para identificar entidades, atributos y grupos vinculados. Estas asociaciones contribuyen a una evaluación del riesgo que se basa en los vínculos conocidos detectados entre la transacción actual y los datos históricos.


Todos estos métodos se utilizan simultáneamente como parte de una estrategia y un enfoque cohesivos a fin de proyectar un perfil de riesgo final.

analysis-4-1

El fraude CNP es dinámico y también lo es la tecnología de Vesta

Cómo funciona la canalización de aprendizaje automático de Vesta

La canalización de aprendizaje automático de Vesta ofrece una solución integral

  • Gestiona las tareas de aprendizaje automático desde los datos sin procesar hasta los modelos de producción
  • Crea y compara varios modelos de aprendizaje automático en una ejecución: bosque aleatorio, árboles de potenciación del gradiente, redes neuronales profundas, etc.
  • Realiza una búsqueda en cuadrícula del mejor modelo
  • Elabora una clasificación de funciones y un informe del rendimiento
  • Crea un modelo complejo en horas

AutoML: automatización de la canalización de aprendizaje automático

AIML

Antes de este concepto de canalización, para entrenar un modelo de aprendizaje automático, los científicos de datos debían llevar a cabo un proceso complejo de varios pasos:

  • Importar los datos del almacén de datos
  • Analizar las variables para evaluar las distribuciones
  • Transformar los datos para convertirlos a un formato que sea adecuado para el algoritmo propuesto
  • Seleccionar solo un subconjunto de variables que sean las más útiles para reducir la carga de cálculo
  • Entrenar varios modelos ajustando los hiperparámetros
  • Evaluar y comparar los modelos para elegir el mejor
  • Implementar el modelo en la producción

Los científicos de datos solían realizar este proceso de forma manual y repetirlo muchas veces a fin de entrenar un modelo.

Vesta creó una plataforma de canalización de aprendizaje automático para estandarizar el proceso de entrenamiento de modelos y mejorar su eficacia. La canalización contiene cada uno de estos pasos como bloques de construcción. Los científicos de datos pueden crear modelos modificando un archivo de configuración para agrupar estos bloques de construcción y personalizarlos. Basándose en el archivo de configuración, la plataforma creará un modelo de producción con los datos sin procesar y generará automáticamente un informe del rendimiento del modelo. Esta plataforma admite algoritmos que van desde el modelo lineal clásico hasta el modelo de aprendizaje automático más avanzado, como los árboles de potenciación del gradiente, las redes neuronales profundas, los bosques aleatorios, etc. También admite algunas técnicas avanzadas que se basan en nuestra investigación, como el modelado de conjuntos, que combina varios modelos para obtener los mejores resultados.

Con la canalización de aprendizaje automático, los científicos de datos pueden crear modelos no lineales complejos en cuestión de horas, cuando en el pasado solía llevar de días a semanas.

 

 

Informes de la canalización de ML

Los informes de la canalización de aprendizaje automático ofrecen información sobre los datos que orientan la creación y el perfeccionamiento de los modelos de ML. Los científicos de datos pueden acceder a estos informes para seguir perfeccionando los modelos mediante el ajuste de los umbrales de las variables.

A continuación, se incluyen algunos ejemplos de los gráficos y las tablas que se generan automáticamente en el proceso automático de presentación de informes de la canalización de ML.

  • Los informes de clasificación de las funciones indican la importancia de cada variable.
  • Las curvas de rendimiento de los modelos comparan el rendimiento de varios modelos.
  • Las comparaciones de búsqueda en cuadrícula proporcionan los parámetros de las variables principales.
  • La distribución de las puntuaciones de entrenamiento y prueba demuestran cómo los diversos modelos obtienen diferentes puntuaciones para los conjuntos de variables de entrenamiento y prueba.
  • La distribución de las puntuaciones proporciona parámetros de diferentes categorías de puntuación, lo que permite que los científicos de datos de Vesta elijan un umbral de corte.
AIML-3

Sistema de actualización automática de modelos (Model Auto-Refresh System, MARS)

Nuestros experimentos demostraron que es necesario volver a entrenar los modelos con frecuencia para detectar nuevos patrones de riesgo. Sobre todo en la industria del riesgo de fraude, los actores maliciosos intentan evitar los modelos existentes una vez que están bloqueados. Volver a entrenar los modelos para detectar nuevos patrones de fraude es fundamental. Sin embargo, el esfuerzo manual que requería mantener y volver a entrenar varios modelos de producción de manera continua era un desafío enorme.

MARS ofrece muchas ventajas sobre un enfoque manual:

  • Automatización total, actualización automática de los modelos de riesgo de producción según el calendario o los criterios preestablecidos.
  • Altamente ampliable, capaz de manejar cientos de modelos.
  • Programador y monitor de trabajo gestionables.
  • Tablero interactivo para el control de la versión del modelo.

Cómo prepararse para abordar los principales desafíos que plantea el fraude

La efectividad de un sistema de lucha contra el fraude se mide por su capacidad de afrontar desafíos emergentes y complejos. Los cinco desafíos más comunes que se afrontan son los siguientes:

1. Comportamientos diversos

  • Los diferentes mercados verticales tendrán patrones de fraude únicos
  • Los atributos de los datos tendrán diferente peso e importancia en los distintos mercados verticales
    • La dirección de envío para el comercio electrónico
    • La recepción de un correo electrónico para la transferencia de dinero
    • El origen y el destino para los viajes con aerolíneas, pero no la dirección de envío
  • Los patrones de fraude regionales agregan otro nivel de diversidad
    • Las capacidades del banco emisor para la verificación y la autorización son diferentes
  • Los eventos a largo plazo y a corto plazo introducen otros patrones de fraude
    • Los patrones estacionales, como el viernes negro
    • Las ventas trimestrales, las ventas de días festivos, etc.

La solución a los comportamientos diversos es utilizar varios modelos con técnicas predictivas de apilamiento. No obstante, esto puede implicar una carga importante para la infraestructura del ML y el rendimiento del sistema contra el fraude. Se requiere un sistema automatizado de ML para entrenar, implementar y mantener un volumen tan elevado de modelos.

2. Comportamientos ocultos

  • Los datos robados, las tarjetas robadas, las entidades falsas, las identidades robadas, los números de teléfono robados y las diferentes direcciones IP son formas de comportamiento oculto que utilizan los criminales para encubrir su identidad.
  • Mientras un atributo se mantenga, con ese atributo se pueden vincular todos los demás para descubrir el comportamiento oculto.
  • La técnica utilizada para hacer frente a esta amenaza es el análisis de vínculos gráficos.

3. Patrones cambiantes

  • Los estafadores intentan engañar al sistema cambiando su comportamiento para imitar un comportamiento seguro.
  • La combinación de modelos no supervisados y adaptativos es efectiva para combatir este patrón de amenaza.
      • Detección de anomalías no supervisada
        Identifica patrones que han pasado inadvertidos y notifica a un analista de fraude para que actualice el modelo de ML. Este proceso es mucho más rápido que esperar los datos devueltos sobre los contracargos, que suelen tardar entre 60 y 90 días o más. Con este enfoque, se pueden realizar ajustes a los modelos en tiempo real.
      • ML adaptativo
        El aprendizaje automático adaptativo produce una actualización continua de los modelos de producción basados en datos nuevos y emergentes. Se desarrollan nuevos modelos candidatos y se prueban con los modelos de producción. Si se comprueba que el modelo candidato es más efectivo, se implementará en la producción.
Una mano humana sobre una tableta y una tarjeta de crédito para hacer compras en línea

4. Demoras en la retroalimentación sobre el fraude

Los datos sobre los contracargos pueden tardar 60 días o más en llegar al sistema contra el fraude. Durante este período, los modelos se degradan y los falsos positivos pueden persistir, lo que genera una mala experiencia del cliente y una pérdida de ganancias.

Se necesita un enfoque de varios niveles para actualizar los modelos con rapidez. Un bucle de retroalimentación eficaz aprovechará el análisis de vínculos gráficos junto con el aprendizaje automático no supervisado y la revisión de los analistas de fraude.

 

5. Los datos de Vesta son de primera categoría

Poor data quality can cause any model to fail.  Vesta is in a unique position. We have built an extensive set of consortium data that includes more than 200M unique data assets assembled over 25+ years in business. Our data includes:

  •  Datos sobre transacciones y comportamientos.
  •  Actualización y almacenamiento en tiempo real, por lo que ofrecen información inmediata a nuestra canalización de ML y nuestros modelos de toma de decisiones.
  • Nuestros métodos de recopilación y almacenamiento cumplen con todos los reglamentos de seguridad y privacidad de datos de las redes de tarjetas y de los países.
Pareja de jóvenes felices haciendo compras en internet

La mejor defensa es un buen ataque:

Fraud is one of the greatest threats businesses face today. Find out how fraud prevention backed by advanced machine learning can position your business for stronger revenue growth.

¡Explora nuestra Guía gratuita para comenzar a controlar el fraude CNP hoy mismo!