
Crédito: Dominio público de Pixabay/CC0
El aumento del comercio electrónico ha traído una comodidad sin precedentes a los consumidores, pero también ha creado un terreno fértil para prácticas engañosas en los mercados en línea. Un cuerpo de investigación creciente ahora se está centrando en la detección de revisiones de productos falsas o engañosas, a menudo denominadas revisiones de spam. Estos se escriben deliberadamente para promover injustamente un producto o dañar la reputación de un competidor.
Estas revisiones usan frecuentemente perfiles fabricados o lenguaje cuidadosamente elaborado, lo que hace que sean difíciles de distinguir de los comentarios genuinos de los clientes. Además, el uso de modelos de idiomas grandes, coloquialmente conocidos como IA generativos, ahora se está utilizando para generar revisiones de spam auténticas.
El impacto de las revisiones de spam es significativo. Los consumidores pueden ser persuadidos para comprar bienes de baja calidad, mientras que las empresas legítimas sufren daños a la reputación. En última instancia, esto podría erosionar la confianza en los mercados digitales. Sin embargo, distinguir entre opiniones auténticas y engañosas es difícil.
Para su artículo publicado en el Revista Internacional de Servicios, Economía y Gestión Los investigadores han recurrido a la minería de opinión computacional, que implica analizar el texto para extraer sentimiento y significado, para detectar patrones indicativos de actividad fraudulenta.
Las técnicas tradicionales incluyen el filtrado para palabras clave sospechosas, monitorear patrones de publicación anormales, evaluar la credibilidad del revisor y emplear herramientas de verificación como los captchas antpamas.
Más recientemente, los avances en el aprendizaje automático (ML) y el procesamiento del lenguaje natural (PNL), que permite que una computadora interprete el lenguaje humano, ha permitido que los sistemas automatizados detecten las señales sutiles lingüísticas y contextuales que a menudo revelan contenido fabricado.
Los investigadores explican que el centro de su enfoque es la creación de conjuntos de datos de verdad terrestres. Estos son ejemplos curados de revisiones reales y falsas. Estos conjuntos de datos proporcionan una referencia para capacitar a los modelos de aprendizaje automático para reconocer indicadores sutiles de engaño, incluidos estilos de escritura inusuales, inconsistencias de sentimiento o anomalías en la estructura de las oraciones.
El nuevo enfoque luego combina múltiples algoritmos en un clasificador híbrido. Un marco de aprendizaje profundo, como una red neuronal convolucional (CNN), que es experta en identificar patrones complejos, se combina con un clasificador estadístico tradicional. La tasa de precisión de este híbrido es de entre 96% y 99% cuando se prueba en conjuntos de datos estándar.
A medida que el comercio electrónico global continúa expandiéndose, los sistemas de detección de spam precisos serán cada vez más importantes para mantener la confiabilidad de los mercados digitales, reforzando la transparencia y la confiabilidad.
Más información:
Pallavi Zambare et al, mayor precisión de detección de revisiones de productos fraudulentos utilizando un enfoque de aprendizaje automático de fusión, Revista Internacional de Servicios, Economía y Gestión (2025). Doi: 10.1504/ijsem.2023.10061262
Citación: Detección de revisiones de productos fraudulentos con mayor precisión (2025, 15 de septiembre) Recuperado el 15 de septiembre de 2025 de https://techxplore.com/news/2025-09-fraudulent-product-accuracy.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.