Optimización de redes neuronales para cualquier tarea


Los investigadores han ideado una nueva forma de ajustar las redes neuronales para cualquier tarea deseada entrenándolas en más de un millón de ejemplos.

Fuente: Dominio público/Pixabay

Las redes neuronales se utilizan para una variedad de tareas, desde predecir si el puntaje de crédito de una persona es lo suficientemente bueno para calificar para un préstamo hasta diagnosticar si un paciente tiene una enfermedad específica. Sin embargo, los investigadores aún conocen de forma limitada cómo funcionan estos modelos. Si un determinado modelo es óptimo para ciertas tareas sigue siendo una pregunta abierta.

Los investigadores del MIT realizaron un análisis de las redes neuronales y demostraron que pueden diseñarse para que sean "óptimas", lo que significa que minimizan la probabilidad de que los prestatarios o los pacientes se coloquen incorrectamente en la categoría incorrecta cuando las redes reciben una gran cantidad de datos de entrenamiento etiquetados. Para lograr la optimización, estas redes deben construirse con una arquitectura específica.

Una red neuronal es básicamente un modelo de aprendizaje automático basado libremente en el cerebro humano. Muchas capas de nodos interconectados o neuronas procesan datos. Los investigadores entrenan a una red para realizar una tarea mostrándole millones de ejemplos de un conjunto de datos. Las funciones de activación ayudan a la red a aprender patrones complejos en los datos de entrada. Lo hacen aplicando una transformación a la salida de una capa antes de enviar datos a la siguiente capa. Cuando los investigadores construyen una red neuronal, eligen una función de activación para usar. También elige el ancho de la red (cuántas neuronas hay en cada capa) y la profundidad (cuántas capas hay en la red).

Después de un análisis detallado, los investigadores encontraron que solo hay tres formas en que este tipo de red puede aprender a clasificar las entradas. Un método clasifica una entrada en función de la mayoría de las entradas en los datos de entrenamiento; Si hay más perros que gatos, decide que cada nueva entrada es un perro. Otro método clasifica eligiendo la etiqueta (perro o gato) del punto de datos de entrenamiento que más se parece a la nueva entrada. El tercer método clasifica una nueva entrada en función de un promedio ponderado de todos los puntos de datos de entrenamiento que son similares a ella. Su análisis muestra que este es el único de los tres métodos que da como resultado un rendimiento óptimo. Identificaron un conjunto de funciones de activación que siempre utilizan este método de clasificación óptimo.

Probaron esta teoría en varias tareas de evaluación comparativa de clasificación y descubrieron que resultó en un mejor rendimiento en muchos casos. Los constructores de redes neuronales podrían usar sus fórmulas para seleccionar una función de activación que produzca un mejor rendimiento de clasificación.

Referencia: Adityanarayanan Radhakrishnan et al, Las redes neuronales amplias y profundas logran consistencia para la clasificación, procedimientos de la Academia Nacional de Ciencias (2023). DOI: 10.1073/pnas.2208779120


Si quieres conocer otros artículos parecidos a Optimización de redes neuronales para cualquier tarea puedes visitar la categoría Electrónica.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir