Logotipo de Zephyrnet

Utilice el aprendizaje automático sin escribir una sola línea de código con Amazon SageMaker Canvas | Servicios web de Amazon

Fecha:

En el pasado reciente, el uso del aprendizaje automático (ML) para hacer predicciones, especialmente para datos en forma de texto e imágenes, requería un amplio conocimiento de ML para crear y ajustar modelos de aprendizaje profundo. Hoy en día, el ML se ha vuelto más accesible para cualquier usuario que quiera utilizar modelos de ML para generar valor empresarial. Con Lienzo de Amazon SageMaker, puede crear predicciones para varios tipos de datos diferentes más allá de los datos tabulares o de series temporales sin escribir una sola línea de código. Estas capacidades incluyen modelos previamente entrenados para tipos de datos de imágenes, texto y documentos.

En esta publicación, analizamos cómo puede utilizar modelos previamente entrenados para recuperar predicciones para tipos de datos admitidos más allá de los datos tabulares.

Datos de texto

SageMaker Canvas proporciona un entorno visual sin código para crear, entrenar e implementar modelos de aprendizaje automático. Para tareas de procesamiento del lenguaje natural (NLP), SageMaker Canvas se integra perfectamente con Amazon Comprehend para permitirle realizar capacidades clave de PNL como detección de lenguaje, reconocimiento de entidades, análisis de sentimientos, modelado de temas y más. La integración elimina la necesidad de que cualquier codificación o ingeniería de datos utilice los sólidos modelos de PNL de Amazon Comprehend. Simplemente proporcione sus datos de texto y seleccione entre cuatro capacidades de uso común: análisis de sentimientos, detección de idioma, extracción de entidades y detección de información personal. Para cada escenario, puede utilizar la interfaz de usuario para probar y utilizar la predicción por lotes para seleccionar los datos almacenados en Servicio de almacenamiento simple de Amazon (Amazon S3).

Análisis de datos de texto en SageMaker Canvas

Análisis de los sentimientos

Con el análisis de sentimiento, SageMaker Canvas le permite analizar el sentimiento de su texto de entrada. Puede determinar si el sentimiento general es positivo, negativo, mixto o neutral, como se muestra en la siguiente captura de pantalla. Esto es útil en situaciones como analizar reseñas de productos. Por ejemplo, el texto "Me encanta este producto, ¡es increíble!". SageMaker Canvas lo clasificaría como un sentimiento positivo, mientras que "Este producto es horrible, me arrepiento de haberlo comprado" se etiquetaría como un sentimiento negativo.

Análisis de sentimiento en SageMaker Canvas

Extracción de entidades

SageMaker Canvas puede analizar texto y detectar automáticamente las entidades mencionadas en él. Cuando se envía un documento a SageMaker Canvas para su análisis, identificará personas, organizaciones, ubicaciones, fechas, cantidades y otras entidades en el texto. Esta capacidad de extracción de entidades le permite obtener rápidamente información sobre las personas, lugares y detalles clave discutidos en los documentos. Para obtener una lista de entidades admitidas, consulte Entidades.

Extracción de entidades en SageMaker Canvas

Detección de idioma

SageMaker Canvas también puede determinar el idioma dominante del texto utilizando Amazon Comprehend. Analiza el texto para identificar el idioma principal y proporciona puntuaciones de confianza para el idioma dominante detectado, pero no indica desgloses porcentuales para documentos multilingües. Para obtener mejores resultados con documentos extensos en varios idiomas, divida el texto en partes más pequeñas y agregue los resultados para estimar los porcentajes de idioma. Funciona mejor con al menos 20 caracteres de texto.

Detección de idioma en SageMaker Canvas

Detección de información personal

También puede proteger datos confidenciales mediante la detección de información personal con SageMaker Canvas. Puede analizar documentos de texto para detectar automáticamente entidades de información de identificación personal (PII), lo que le permite localizar datos confidenciales como nombres, direcciones, fechas de nacimiento, números de teléfono, direcciones de correo electrónico y más. Analiza documentos de hasta 100 KB y proporciona una puntuación de confianza para cada entidad detectada para que pueda revisar y redactar selectivamente la información más confidencial. Para obtener una lista de entidades detectadas, consulte Detección de entidades PII.

Detección de PII en SageMaker Canvas

Datos de imagen

SageMaker Canvas proporciona una interfaz visual sin código que le facilita el uso de capacidades de visión por computadora al integrarse con Reconocimiento de amazonas para análisis de imágenes. Por ejemplo, puede cargar un conjunto de datos de imágenes, utilizar Amazon Rekognition para detectar objetos y escenas y realizar detección de texto para abordar una amplia gama de casos de uso. La interfaz visual y la integración de Amazon Rekognition hacen posible que los no desarrolladores aprovechen técnicas avanzadas de visión por computadora.

Análisis de datos de imágenes en SageMaker Canvas

Detección de objetos en imágenes.

SageMaker Canvas utiliza Amazon Rekognition para detectar etiquetas (objetos) en una imagen. Puede cargar la imagen desde la interfaz de usuario de SageMaker Canvas o utilizar el Predicción por lotes para seleccionar imágenes almacenadas en un depósito S3. Como se muestra en el siguiente ejemplo, puede extraer objetos de la imagen, como la torre del reloj, el autobús, los edificios y más. Puede utilizar la interfaz para buscar entre los resultados de la predicción y ordenarlos.

Detección de objetos en imágenes en SageMaker Canvas

Detección de texto en imágenes

Extraer texto de imágenes es un caso de uso muy común. Ahora puede realizar esta tarea con facilidad en SageMaker Canvas sin código. El texto se extrae como líneas de pedido, como se muestra en la siguiente captura de pantalla. Las frases cortas dentro de la imagen se clasifican juntas y se identifican como una frase.

Detección de texto en imágenes en SageMaker Canvas

Puede realizar predicciones por lotes cargando un conjunto de imágenes, extrayendo todas las imágenes en un solo trabajo por lotes y descargando los resultados como un archivo CSV. Esta solución es útil cuando desea extraer y detectar texto en imágenes.

Datos del documento

SageMaker Canvas ofrece una variedad de soluciones listas para usar que resuelven sus necesidades diarias de comprensión de documentos. Estas soluciones están impulsadas por Amazon Textil. Para ver todas las opciones disponibles para documentos, elija Modelos listos para usar en el panel de navegación y filtrar por Documentos, como se muestra en la siguiente captura de pantalla.

Análisis de datos de documentos en SageMaker Canvas

Análisis de documentos

El análisis de documentos analiza documentos y formularios en busca de relaciones entre el texto detectado. Las operaciones devuelven cuatro categorías de extracción de documentos: texto sin formato, formularios, tablas y firmas. La capacidad de la solución para comprender la estructura del documento le brinda flexibilidad adicional en el tipo de datos que desea extraer de los documentos. La siguiente captura de pantalla es un ejemplo de cómo se ve la detección de tablas.

Análisis de documentos en SageMaker Canvas

Esta solución es capaz de comprender diseños de documentos complejos, lo que resulta útil cuando necesita extraer información específica de sus documentos.

Análisis de documentos de identidad.

Esta solución está diseñada para analizar documentos como tarjetas de identificación personal, licencias de conducir u otras formas similares de identificación. Para cada documento de identidad se devolverá información como el segundo nombre, el condado y el lugar de nacimiento, junto con su puntuación de confianza individual sobre la precisión, como se muestra en la siguiente captura de pantalla.

Análisis de documentos de identidad en SageMaker Canvas

Existe una opción para realizar predicciones por lotes, mediante la cual puede cargar conjuntos de documentos de identificación de forma masiva y procesarlos como un trabajo por lotes. Esto proporciona una forma rápida y sencilla de transformar los detalles del documento de identificación en pares clave-valor que se pueden utilizar para procesos posteriores, como el análisis de datos.

Análisis de gastos

El análisis de gastos está diseñado para analizar documentos de gastos como facturas y recibos. La siguiente captura de pantalla es un ejemplo de cómo se ve la información extraída.

Análisis de gastos en SageMaker Canvas

Los resultados se devuelven como campos de resumen y campos de partidas individuales. Los campos de resumen son pares clave-valor extraídos del documento y contienen claves como Total, Fecha de vencimientoy Impuestos. Los campos de elementos de línea se refieren a datos estructurados como una tabla en el documento. Esto es útil para extraer información del documento manteniendo su diseño.

Consultas de documentos

Las consultas de documentos están diseñadas para que usted pueda hacer preguntas sobre sus documentos. Esta es una excelente solución para usar cuando tiene documentos de varias páginas y desea extraer respuestas muy específicas de sus documentos. El siguiente es un ejemplo de los tipos de preguntas que puede hacer y cómo se ven las respuestas extraídas.

Consultas de documentos en SageMaker Canvas

La solución proporciona una interfaz sencilla para que pueda interactuar con sus documentos. Esto resulta útil cuando desea obtener detalles específicos en documentos grandes.

Conclusión

SageMaker Canvas proporciona un entorno sin código para utilizar ML con facilidad en varios tipos de datos como texto, imágenes y documentos. La interfaz visual y la integración con servicios de AWS como Amazon Comprehend, Amazon Rekognition y Amazon Textract eliminan la necesidad de codificación e ingeniería de datos. Puede analizar texto en busca de opiniones, entidades, idiomas y PII. Para imágenes, la detección de objetos y texto permite casos de uso de visión por computadora. Finalmente, el análisis de documentos puede extraer texto preservando su diseño para procesos posteriores. Las soluciones listas para usar en SageMaker Canvas le permiten aprovechar técnicas avanzadas de aprendizaje automático para generar información a partir de datos estructurados y no estructurados. Si está interesado en utilizar herramientas sin código con modelos de aprendizaje automático listos para usar, pruebe SageMaker Canvas hoy. Para obtener más información, consulte Introducción al uso de Amazon SageMaker Canvas.


Sobre los autores

Julia Ang es un arquitecto de soluciones con sede en Singapur. Ha trabajado con clientes en una variedad de campos, desde la salud y el sector público hasta empresas nativas digitales, para adoptar soluciones de acuerdo con sus necesidades comerciales. También ha apoyado a clientes en el Sudeste Asiático y más allá para que utilicen AI y ML en sus negocios. Fuera del trabajo, le gusta aprender sobre el mundo viajando y participando en actividades creativas.

Loke Jun Kai es un arquitecto de soluciones especializado en IA/ML con sede en Singapur. Trabaja con clientes de toda la ASEAN para diseñar soluciones de aprendizaje automático a escala en AWS. Jun Kai es un defensor de las herramientas de aprendizaje automático Low-Code No-Code. En su tiempo libre le gusta estar con la naturaleza.

punto_img

Información más reciente

punto_img