Por qué el fraude con tarjeta no presente (CNP) es una amenaza en constante evolución para las empresas de comercio electrónico

El fraude CNP es una gran preocupación que enfrentan las empresas de comercio electrónico. Y así como puede parecer que lo tienes bajo control, evoluciona y surgen nuevos riesgos. Se estima que, para 2023, las empresas de comercio electrónico perderán $130 000 millones por fraude. Lamentablemente, las medidas que muchos negocios toman a fin de controlar el fraude acaban costándoles más que las pérdidas directas por fraude. Los falsos positivos, la declinación de pedidos legítimos debido a sospechas de fraude, les cuestan a las empresas $118 000 millones en un año promedio.

Los desafíos son importantes

Finalizar la compra

Los negocios hacen frente a un verdadero desafío cuando se trata del fraude CNP. Si bien reconocen los riesgos y han implementado soluciones para combatir el fraude, muchas veces no alcanzan el resultado que desean. Hay un enorme impacto financiero asociado a las declinaciones en falso. Se trata de ganancias que las empresas desaprovechan. Y los clientes a los que declinan suelen explorar otras opciones la próxima vez que compran. También es probable que las empresas se enfrenten a un alto índice de fraude por contracargos. Saben que están abarcando demasiado, pero sus esfuerzos por controlar el problema no están funcionando. Las estrategias contra el fraude basadas en reglas siempre parecen ir un paso por detrás de los criminales. Los costos de los sistemas de control del fraude y de gestión de contracargos se están yendo por las nubes y ofrecen muy pocos resultados. Desarrollar métodos de detección precisos y oportunos es fundamental, pero difícil.

Un sistema efectivo de control del fraude debe hacer lo siguiente:

  • Abordar los comportamientos fraudulentos diversos y ocultos
  • Reconocer los patrones cambiantes de fraude
  • Proporcionar retroalimentación de manera oportuna
  • Adaptarse con rapidez y precisión a las amenazas emergentes
  • Reducir en gran medida los falsos positivos

 

¿Cuál es la diferencia entre

los sistemas de control del fraude proactivos y reactivos?

 

La mayoría de los sistemas de control del fraude comienzan con la detección proactiva basada en reglas. Estas herramientas tienen importantes limitaciones. Solo pueden detectar patrones de fraude sencillos que se basan en una cantidad limitada de atributos o variables. Requieren una gran cantidad de esfuerzo manual para definir y codificar cada regla. Una vez que se ponen en funcionamiento, estos sistemas suelen ser lentos para responder debido a que el procesamiento es excesivamente pesado.

Los sistemas de control del fraude reactivos que se basan en la inteligencia artificial (AI) y el aprendizaje automático (ML) son superiores al enfoque proactivo basado en reglas. Ofrecen una detección muy superior de patrones complejos y correlaciones no lineales. Pueden manejar cientos de atributos en lugar de unos pocos y son capaces de analizar grandes cantidades de datos y de responder con mayor rapidez. Uno de los principales beneficios de los sistemas de AI/ML es su capacidad de aprender una amplia gama de patrones de fraude y de desarrollar y entrenar nuevos modelos automáticamente. Los nuevos modelos candidatos se desarrollan en la canalización de ML, se comprueba su eficacia y, una vez comprobada, se implementan en la producción.

 

 

Por qué el aprendizaje automático no es una solución milagrosa

intgration-1En este punto, los comerciantes podrían llegar a la errónea conclusión de que un sistema de AI/ML resuelve todos los desafíos que plantea el fraude. Por sí solo, simplemente no lo hace.

Los sistemas de IA/ML tienen varias dependencias y pueden fallar por muchas razones.

  1. La ingeniería de funciones llevada a cabo por expertos es clave para el rendimiento del sistema. La experiencia en la materia es fundamental para perfeccionar y optimizar los modelos.
  2. La calidad de los datos determina el límite superior del rendimiento del modelo. El dicho "basura entra, basura sale" es particularmente válido cuando se analiza la eficacia de cualquier sistema de IA/ML. Sin el acceso a los datos del consorcio y al intercambio colaborativo de datos, la visión y la precisión de un modelo son limitadas.
  3. Cada algoritmo apunta a una amenaza específica. De manera aislada, un modelo nunca será adecuado. Es fundamental aplicar una estrategia cohesiva que proporcione una cobertura organizada.
  4. La inteligencia artificial y el aprendizaje automático no son soluciones independientes y no se debe esperar que actúen como tales. Los sistemas líderes de fraude aprovechan una amplia gama de tecnologías, entre las que se incluyen las siguientes:
    • AI/ML
    • Datos del consorcio
    • Análisis de vínculos gráficos
    • Autenticación avanzada de la identidad
    • Espera silenciosa
    • Y mucho más…

 

En qué se diferencia el enfoque de Vesta sobre el fraude CNP

response-1

Nuestra meta es aumentar las ganancias

para las empresas

Aplicamos un enfoque de varios niveles para prevenir el fraude a través de lo siguiente:
  • Análisis de datos sobre el comportamiento y los dispositivos
    • En general, Vesta utiliza más de 200 millones de activos de datos únicos. Entre estos datos, se incluyen los datos de terceros, de redes sociales, correos electrónicos, teléfonos, huellas digitales y mucho más.
  • Políticas
    • Las políticas son un filtro de primer nivel para detener el fraude evidente y se pueden utilizar para eliminar los valores anormales fáciles de detectar.
  • Aprendizaje automático
    El ML comprende muchas tecnologías, como las siguientes:
    • Análisis de vínculos gráficos
    • Técnicas de conjuntos
    • Aprendizaje supervisado
    • Detección de anomalías y alertas de fraude
  • Factor humano
    • La revisión realizada por los analistas de fraude es una parte importante de un sistema eficaz de control del fraude. Cabe aclarar que no es lo mismo que la revisión manual. Los analistas de fraude son científicos de datos capacitados con títulos avanzados en matemáticas, estadística y análisis de datos que utilizan su experiencia para perfeccionar los modelos a fin de lograr un rendimiento óptimo.
    • La demora en la toma de decisiones mediante la espera silenciosa permite demorar la decisión final sobre el fraude mientras se reúnen y evalúan otros datos.
    • Puede utilizarse una autenticación secundaria, como el redireccionamiento a 3DS si se requieren más autenticaciones para validar la legitimidad de una transacción.

Los pilares fundamentales de la estrategia de aprendizaje automático de Vesta son los siguientes:

  • Aprendizaje automático supervisado
    • Esta es la técnica más común utilizada en nuestro portafolio de aprendizaje automático. Los modelos se entrenan con miles de millones de transacciones etiquetadas como legítimas o fraudulentas. Se perfeccionan a través de un ciclo de aprendizaje repetitivo en el que se realizan predicciones en tiempo real y los resultados se utilizan para seguir alimentando el proceso de entrenamiento.
  • Aprendizaje automático no supervisado
    • En los casos en los que los datos de las transacciones etiquetadas no están disponibles o son muy limitados, se pueden utilizar modelos de autoaprendizaje. Estos sistemas están diseñados para detectar comportamientos anómalos mediante la detección de patrones únicos fuera de los niveles. Se incorporan las recomendaciones para perfeccionar los nuevos modelos candidatos que se evalúan antes de implementarlos en la producción.
  • Aprendizaje automático adaptativo
    • El aprendizaje automático adaptativo gestiona la evolución de los patrones de fraude a través de un proceso de actualizaciones continuas basadas en la retroalimentación sobre el fraude.
  • Análisis de vínculos gráficos en tiempo real
    • Esta técnica se utiliza para identificar entidades, atributos y grupos vinculados. Estas asociaciones contribuyen a una evaluación del riesgo que se basa en los vínculos conocidos detectados entre la transacción actual y los datos históricos.


Todos estos métodos se utilizan simultáneamente como parte de una estrategia y un enfoque cohesivos a fin de proyectar un perfil de riesgo final.

analysis-4-1

El fraude CNP es dinámico y también lo es la tecnología de Vesta

La plataforma de toma de decisiones sobre transacciones de Vesta es un ecosistema altamente integrado que está compuesto por un sistema de toma de decisiones en tiempo real - UFS, y un almacén de datos casi en tiempo real que analiza las transacciones de manera constante. Este sistema está conectado a un servicio informático en la nube donde se entrenan los modelos de aprendizaje automático. Los modelos entrenados se implementan en la producción para tomar decisiones en tiempo real.

AIML-1

El aprendizaje automático cumple una función esencial en el sistema de toma de decisiones de Vesta. Para las decisiones de riesgo de Vesta, recopilamos una cantidad mínima de datos del cliente final en tiempo real para garantizar la mejor experiencia del cliente posible.

Una estrategia sofisticada de recopilación de datos:

  • Recopilar una cantidad mínima de datos de los clientes para garantizar la mejor experiencia del cliente posible
  • Obtener los tipos de datos correctos de fuentes de terceros
  • Recopilar la cantidad máxima de datos disponibles de terceros a fin de reducir el impacto en el cliente
  • Recopilar datos de comportamiento, datos de dispositivos y datos sociales cuando esté permitido legalmente

 

Obtenemos ciertos datos de terceros a fin de aumentar nuestro poder de predicción. El equipo de riesgos añade estos datos a un conjunto de variables derivadas. Por lo general, cada transacción se puede describir con unos cuantos miles de variables. Con todos estos datos, los científicos de datos entrenan los modelos de aprendizaje automático para extraer patrones a fin de predecir si una futura transacción es legítima o fraudulenta.

Hemos hecho importantes inversiones en la expansión de nuestro producto para la recopilación de datos sobre el comportamiento, con soluciones fáciles de implementar basadas en navegadores y aplicaciones nativas, que hacen que los datos fluyan hacia nuestra plataforma de toma de decisiones para utilizarlos en el modelado del comportamiento, lo que aumenta aún más los índices de aprobación. Nuestro almacén de datos crece constantemente y nuestros procesos patentados de análisis de vínculos nos permiten aprovechar los vínculos de todo el historial de pedidos a fin de detectar los que son fraudulentos y no fraudulentos a lo largo del tiempo en el análisis profundo de vínculos. Mediante el uso del análisis de vínculos en tiempo real y en un plazo más corto según la transacción, podemos crear funciones de modelos basadas en vínculos críticos que arrojan resultados excepcionales. Nuestra canalización de aprendizaje automático desarrollada internamente ofrece un proceso automatizado de entrenamiento y selección de modelos que nos permite volver a entrenar y crear modelos avanzados en cuestión de horas, lo que nos brinda la capacidad de mantener modelos específicos para el cliente cuando sea necesario a fin de mejorar los índices generales de aprobación. Existen técnicas avanzadas, como el modelado de conjuntos y el aprendizaje profundo, que son compatibles con nuestra canalización. Los modelos no supervisados evalúan todas nuestras transacciones para detectar comportamientos anómalos, lo que genera alertas que nuestro equipo de analistas de fraude revisa en busca de actividades fraudulentas. Si se descubren patrones de fraude, nuestra canalización automática nos permite volver a entrenar los modelos con la inteligencia actualizada en cuestión de horas.

Cómo funciona la canalización de aprendizaje automático de Vesta

La canalización de aprendizaje automático de Vesta ofrece una solución integral

  • Gestiona las tareas de aprendizaje automático desde los datos sin procesar hasta los modelos de producción
  • Crea y compara varios modelos de aprendizaje automático en una ejecución: bosque aleatorio, árboles de potenciación del gradiente, redes neuronales profundas, etc.
  • Realiza una búsqueda en cuadrícula del mejor modelo
  • Elabora una clasificación de funciones y un informe del rendimiento
  • Crea un modelo complejo en horas

AutoML: automatización de la canalización de aprendizaje automático

AIML

Antes de este concepto de canalización, para entrenar un modelo de aprendizaje automático, los científicos de datos debían llevar a cabo un proceso complejo de varios pasos:

  • Importar los datos del almacén de datos
  • Analizar las variables para evaluar las distribuciones
  • Transformar los datos para convertirlos a un formato que sea adecuado para el algoritmo propuesto
  • Seleccionar solo un subconjunto de variables que sean las más útiles para reducir la carga de cálculo
  • Entrenar varios modelos ajustando los hiperparámetros
  • Evaluar y comparar los modelos para elegir el mejor
  • Implementar el modelo en la producción

Los científicos de datos solían realizar este proceso de forma manual y repetirlo muchas veces a fin de entrenar un modelo.

Vesta creó una plataforma de canalización de aprendizaje automático para estandarizar el proceso de entrenamiento de modelos y mejorar su eficacia. La canalización contiene cada uno de estos pasos como bloques de construcción. Los científicos de datos pueden crear modelos modificando un archivo de configuración para agrupar estos bloques de construcción y personalizarlos. Basándose en el archivo de configuración, la plataforma creará un modelo de producción con los datos sin procesar y generará automáticamente un informe del rendimiento del modelo. Esta plataforma admite algoritmos que van desde el modelo lineal clásico hasta el modelo de aprendizaje automático más avanzado, como los árboles de potenciación del gradiente, las redes neuronales profundas, los bosques aleatorios, etc. También admite algunas técnicas avanzadas que se basan en nuestra investigación, como el modelado de conjuntos, que combina varios modelos para obtener los mejores resultados.

Con la canalización de aprendizaje automático, los científicos de datos pueden crear modelos no lineales complejos en cuestión de horas, cuando en el pasado solía llevar de días a semanas.

 

 

Informes de la canalización de ML

Los informes de la canalización de aprendizaje automático ofrecen información sobre los datos que orientan la creación y el perfeccionamiento de los modelos de ML. Los científicos de datos pueden acceder a estos informes para seguir perfeccionando los modelos mediante el ajuste de los umbrales de las variables.

A continuación, se incluyen algunos ejemplos de los gráficos y las tablas que se generan automáticamente en el proceso automático de presentación de informes de la canalización de ML.

  • Los informes de clasificación de las funciones indican la importancia de cada variable.
  • Las curvas de rendimiento de los modelos comparan el rendimiento de varios modelos.
  • Las comparaciones de búsqueda en cuadrícula proporcionan los parámetros de las variables principales.
  • La distribución de las puntuaciones de entrenamiento y prueba demuestran cómo los diversos modelos obtienen diferentes puntuaciones para los conjuntos de variables de entrenamiento y prueba.
  • La distribución de las puntuaciones proporciona parámetros de diferentes categorías de puntuación, lo que permite que los científicos de datos de Vesta elijan un umbral de corte.
AIML-3

Sistema de actualización automática de modelos (Model Auto-Refresh System, MARS)

Nuestros experimentos demostraron que es necesario volver a entrenar los modelos con frecuencia para detectar nuevos patrones de riesgo. Sobre todo en la industria del riesgo de fraude, los actores maliciosos intentan evitar los modelos existentes una vez que están bloqueados. Volver a entrenar los modelos para detectar nuevos patrones de fraude es fundamental. Sin embargo, el esfuerzo manual que requería mantener y volver a entrenar varios modelos de producción de manera continua era un desafío enorme.

MARS ofrece muchas ventajas sobre un enfoque manual:

  • Automatización total, actualización automática de los modelos de riesgo de producción según el calendario o los criterios preestablecidos.
  • Altamente ampliable, capaz de manejar cientos de modelos.
  • Programador y monitor de trabajo gestionables.
  • Tablero interactivo para el control de la versión del modelo.

Cómo prepararse para abordar los principales desafíos que plantea el fraude

La efectividad de un sistema de lucha contra el fraude se mide por su capacidad de afrontar desafíos emergentes y complejos. Los cinco desafíos más comunes que se afrontan son los siguientes:

1. Comportamientos diversos

  • Los diferentes mercados verticales tendrán patrones de fraude únicos
  • Los atributos de los datos tendrán diferente peso e importancia en los distintos mercados verticales
    • La dirección de envío para el comercio electrónico
    • La recepción de un correo electrónico para la transferencia de dinero
    • El origen y el destino para los viajes con aerolíneas, pero no la dirección de envío
  • Los patrones de fraude regionales agregan otro nivel de diversidad
    • Las capacidades del banco emisor para la verificación y la autorización son diferentes
  • Los eventos a largo plazo y a corto plazo introducen otros patrones de fraude
    • Los patrones estacionales, como el viernes negro
    • Las ventas trimestrales, las ventas de días festivos, etc.

La solución a los comportamientos diversos es utilizar varios modelos con técnicas predictivas de apilamiento. No obstante, esto puede implicar una carga importante para la infraestructura del ML y el rendimiento del sistema contra el fraude. Se requiere un sistema automatizado de ML para entrenar, implementar y mantener un volumen tan elevado de modelos.

2. Comportamientos ocultos

  • Los datos robados, las tarjetas robadas, las entidades falsas, las identidades robadas, los números de teléfono robados y las diferentes direcciones IP son formas de comportamiento oculto que utilizan los criminales para encubrir su identidad.
  • Mientras un atributo se mantenga, con ese atributo se pueden vincular todos los demás para descubrir el comportamiento oculto.
  • La técnica utilizada para hacer frente a esta amenaza es el análisis de vínculos gráficos.

3. Patrones cambiantes

  • Los estafadores intentan engañar al sistema cambiando su comportamiento para imitar un comportamiento seguro.
  • La combinación de modelos no supervisados y adaptativos es efectiva para combatir este patrón de amenaza.
      • Detección de anomalías no supervisada
        Identifica patrones que han pasado inadvertidos y notifica a un analista de fraude para que actualice el modelo de ML. Este proceso es mucho más rápido que esperar los datos devueltos sobre los contracargos, que suelen tardar entre 60 y 90 días o más. Con este enfoque, se pueden realizar ajustes a los modelos en tiempo real.
      • ML adaptativo
        El aprendizaje automático adaptativo produce una actualización continua de los modelos de producción basados en datos nuevos y emergentes. Se desarrollan nuevos modelos candidatos y se prueban con los modelos de producción. Si se comprueba que el modelo candidato es más efectivo, se implementará en la producción.
Una mano humana sobre una tableta y una tarjeta de crédito para hacer compras en línea

4. Demoras en la retroalimentación sobre el fraude

Los datos sobre los contracargos pueden tardar 60 días o más en llegar al sistema contra el fraude. Durante este período, los modelos se degradan y los falsos positivos pueden persistir, lo que genera una mala experiencia del cliente y una pérdida de ganancias.

Se necesita un enfoque de varios niveles para actualizar los modelos con rapidez. Un bucle de retroalimentación eficaz aprovechará el análisis de vínculos gráficos junto con el aprendizaje automático no supervisado y la revisión de los analistas de fraude.

 

5. Los datos de Vesta son de primera categoría

La mala calidad de los datos puede provocar que cualquier modelo fracase.  Vesta está en una posición única. Hemos creado un amplio consorcio de datos que contiene más de 200 millones de activos de datos únicos recopilados durante más de 20 años en actividad. Nuestros datos incluyen lo siguiente:

  •  Datos sobre transacciones y comportamientos.
  •  Actualización y almacenamiento en tiempo real, por lo que ofrecen información inmediata a nuestra canalización de ML y nuestros modelos de toma de decisiones.
  • Nuestros métodos de recopilación y almacenamiento cumplen con todos los reglamentos de seguridad y privacidad de datos de las redes de tarjetas y de los países.
Pareja de jóvenes felices haciendo compras en internet

La mejor defensa es un buen ataque:

El fraude es una de las grandes amenazas que enfrentan las empresas en la actualidad. Descubre cómo la inteligencia artificial y el aprendizaje automático pueden posicionar a tu empresa para lograr un mayor crecimiento de las ganancias.

¡Explora nuestra Guía gratuita para comenzar a controlar el fraude CNP hoy mismo!