El aprendizaje automático aplicado al procesamiento inteligente de documentos
- Gestión de información
Muchas organizaciones han recurrido a la tecnología para abordar sus necesidades de clasificación de contenido y extracción de datos. OpenText™ aprovecha un enfoque de aprendizaje automático continuo que ofrece flexibilidad, precisión y eficiencia para la captura automatizada de información.
Los archivos digitales han reemplazado a muchos documentos en papel, y se espera que el volumen de contenido se dispare en los próximos años. Muchas organizaciones aprovechan las soluciones inteligentes de procesamiento de documentos para ayudarlas a hacer frente a la avalancha de documentos digitales. Pero incluso las plataformas automatizadas de hoy en día pueden quedarse atrás.
A medida que el contenido y los diseños de los documentos cambian con el tiempo, los sistemas requieren tareas manuales costosas y que consumen mucho tiempo y reducen la eficiencia y los ingresos. La IA añade eficiencia y precisión a los flujos de trabajo de captura automatizados. Desafortunadamente, los modelos de aprendizaje automático también pueden requerir tiempo y recursos para entrenarse y calibrarse.
Mantener la precisión de los modelos depende de las actualizaciones periódicas de los científicos de datos en un ciclo de reentrenamiento que requiere mucha mano de obra, a veces a nivel de código y base de datos. Estos conjuntos de habilidades y actividades especializadas tienen un coste considerable, y, por lo general, las actualizaciones se producen periódicamente y sin la participación de los trabajadores del conocimiento clave. Ello está provocando el cambio del aprendizaje automático al aprendizaje automático continuo (CML).
Muchas organizaciones han recurrido a CML para abordar sus necesidades de clasificación de contenido y extracción de datos para permitir el procesamiento inteligente de documentos. Con CML, los modelos se actualizan sobre la marcha a medida que encuentran nuevos datos y diseños en producción. Las actualizaciones se producen en tiempo real en pequeños lotes, lo que reduce el tiempo de cálculo. Y lo que es más importante, CML reduce los datos y los recursos humanos necesarios para volver a entrenar los modelos de aprendizaje automático.
Los productos de captura de información y las soluciones de procesamiento inteligente de documentos de OpenText™ resuelven el desafío del aprendizaje automático mediante la incorporación de CML. El enfoque de OpenText para CML se basa en la metodología integrada en su motor de extracción de información (IEE). Los datos y los diferentes diseños pueden reforzarse rápidamente con solo unos pocos clics por parte de un trabajador del conocimiento utilizando una interfaz de usuario humana. IEE evalúa continuamente la retroalimentación humana para reforzar o ajustar el modelo en consecuencia, y elimina la necesidad de un equipo de científicos de datos para mantener y volver a entrenar los modelos de aprendizaje automático.