in

Clasificación y extracción de datos de préstamos hipotecarios con Amazon Textract | Servicios web de Amazon

Las solicitudes de préstamos hipotecarios, al menos en los Estados Unidos, comprenden alrededor de 500 o más páginas de documentos diversos. Para que las solicitudes sean revisadas, todos estos documentos deben clasificarse y extraerse los datos de cada formulario. ¡Esto no es tan fácil como podría parecer! Además de diferentes estructuras de datos en cada documento, el mismo elemento de datos puede tener diferentes nombres en diferentes documentos, por ejemplo, SSN, número de seguro social o identificación fiscal. Estos tres se refieren a los mismos datos.

Hoy, una nueva API de análisis de préstamos, para analizar y clasificar los documentos contenidos en los paquetes de solicitud de préstamos hipotecarios y extraer los datos que contienen, está disponible para Amazon Textract. La nueva API se creó en respuesta a las solicitudes de los principales prestamistas de la industria para ayudarlos a procesar las solicitudes más rápido y reducir los errores, lo que mejora la experiencia del cliente final y reduce los costos operativos.

Hasta ahora, la clasificación y la extracción de datos de los paquetes de solicitud de préstamos hipotecarios han sido tareas que requieren mucho trabajo humano, aunque algunos prestamistas han utilizado un enfoque híbrido, utilizando tecnología como Amazon Textract. Sin embargo, los clientes nos dijeron que necesitaban una automatización del flujo de trabajo aún mayor para acelerar los esfuerzos de automatización y reducir el error humano para que su personal pudiera concentrarse en tareas de mayor valor.

La nueva API también proporciona servicios adicionales de valor agregado. Es capaz de realizar la detección de firmas en términos de qué documentos tienen firmas y cuáles no. También proporciona un resultado resumido de los documentos en un paquete de solicitud de hipoteca e identifica documentos importantes seleccionados, como extractos bancarios y formularios 1003 que normalmente estarían presentes. El nuevo flujo de trabajo está impulsado por una colección de modelos de aprendizaje automático (ML). Cuando se carga un paquete de solicitud de hipoteca, el flujo de trabajo clasifica los documentos en el paquete antes de enrutarlos al modelo ML correcto, según su clasificación, para la extracción de datos.

Prueba de conducción de la nueva API de análisis de préstamos
Aunque la nueva API está destinada a que los prestamistas la incorporen a sus flujos de trabajo y aplicaciones de procesos comerciales, cualquiera puede probarla utilizando la consola de Amazon Textract. Esto le permite ver cómo la API clasifica los documentos y extrae los elementos de datos que contienen. Si está interesado en la aplicación de aprendizaje automático e inteligencia artificial, esto puede ser de su interés incluso si no está procesando un paquete de solicitud de hipoteca.

Comienzo abriendo la consola de Amazon Textract, expandiendo Analizar préstamos en el panel de navegación y luego seleccionando Manifestación. La consola de demostración analiza inmediatamente un conjunto de archivos de prueba sintéticos y genera los resultados que se muestran a continuación (siempre puede reiniciar la demostración haciendo clic en el botón Restablecer demostración botón). Obtengo un resumen de los resultados del análisis y un carrusel de documentos para cada uno de los documentos del paquete. La consola de demostración también tiene un práctico panel de ayuda que contiene (entre otras cosas) un resumen de la terminología relacionada con los documentos.

En el carrusel, puedo ver que un documento tiene una insignia de firma, lo que indica que se detectó una firma, pero, antes de echar un vistazo, si me desplazo por el carrusel, puedo ver que un documento estaba etiquetado como Sin clasificar:

Volviendo en el carrusel al documento marcado con una insignia de firma, puedo ver que es un cheque. La detección de firmas suele ser un proceso muy manual, por lo que hacer que el análisis de documentos marque automáticamente cuando se detecta una es un ahorro de tiempo significativo.

Los recibos de pago son otro tipo de documento que los clientes nos han dicho que puede ser difícil y lento de manejar. Al seleccionar el recibo de pago detectado en el carrusel, se muestran los datos extraídos del mismo.

Los datos sintéticos en la consola de demostración brindan una descripción general de cómo la API puede analizar, clasificar y extraer datos de los documentos en un paquete de solicitud de hipoteca. Sin embargo, también puedo usar mis propios documentos. Para hacer esto en la consola de demostración, hago clic en el Subir paquete y proporcione un solo archivo, de hasta 5 MB y 10 páginas como máximo para probar en la consola de demostración, que contiene documentos para analizar. Fuera de uso en la consola de demostración, la API admite documentos con hasta 3000 páginas.

Los resultados, tanto para los datos sintéticos como para los suyos propios, se pueden descargar haciendo clic en el Descargar resultados botón. Esto proporciona un archivo .zip que contiene cuatro archivos: dos son las respuestas JSON sin procesar de la API. Los otros dos son archivos en formato CSV que contienen el resumen (summary.csv) y los datos extraídos (extractions.csv). Ambos archivos están en formato clave-valor.

El contenido del archivo de datos de resumen, para los datos de prueba sintéticos, se encuentra a continuación.

'DocumentName,'FirstPage,'LastPage
"'Payslips","'1","'1"
"'Checks","'2","'2"
"'Identity document","'3","'3"
"'1099 DIV","'4","'4"
"'Bank statement","'5","'5"
"'W2","'6","'6"
"'Unclassified","'7","'7"

A continuación se muestra un ejemplo de los datos contenidos en el archivo de extracciones.

'key,'value
"'PAY PERIOD END DATE","'7/18/2008"
"'PAY DATE","'7/25/2008"
"'BORROWER NAME","'JOHN STILES"
"'BORROWER ADDRESS","'101 MAIN STREET ANYTOWN, USA 12345"
"'COMPANY NAME","'ANY COMPANY CORP."
"'COMPANY ADDRESS","'475 ANY AVENUE ANYTOWN, USA 10101"
"'FEDERAL FILING STATUS","'Married"
"'STATE FILING STATUS","'2"
"'CURRENT GROSS PAY","'$ 452.43"
"'YTD GROSS PAY","'23,526.80"
"'CURRENT NET PAY","'$ 291.90"
"'REGULAR HOURLY RATE","'10.00"
"'HOLIDAY HOURLY RATE","'10.00"
"'WARNINGS MESSAGES NOTES","'EFFECTIVE THIS PAY PERIOD YOUR REGULAR HOURLY RATE HAS BEEN CHANGED FROM $8.00 TO $10.00 PER HOUR."
"'CURRENT REGULAR PAY","'320"
...

Pruebe la API de análisis de préstamos usted mismo
La nueva API está disponible en todas las regiones donde se ofrece Amazon Textract, pero tenga en cuenta que el flujo de trabajo y el procesamiento se centran en documentos centrados en los EE. UU. El precio de la nueva API es el mismo que el de la tabla, el formulario y las consultas existentes. Puede encontrar más detalles en la página de precios del servicio. Finalmente, puede leer más sobre la API en la Guía para desarrolladores.

¡Explore la nueva API de análisis de préstamos por sí mismo hoy en la consola de Amazon Textract!

—Steve



Fuente

Kendal nos sorprende con su cosplay de Red Sonja de Marvel Cómics

Melissa Lissonova nos enamora con el cosplay de Rei Ayanami de Evangelion