Luz
La capacidad de ChatGPT para producir ensayos, correos electrónicos y códigos pulidos en respuesta a unas pocas consultas simples ha atraído la atención internacional. Investigadores del MIT han informado sobre un método que tiene el potencial de allanar el camino para programas de aprendizaje automático muchas veces más capaces que el responsable de ChatGPT. Además, su tecnología podría consumir menos energía que las supercomputadoras de última generación que impulsan los modelos actuales de aprendizaje automático.
El equipo informa sobre la primera demostración experimental del nuevo sistema, que utiliza cientos de láseres a escala de micrones para realizar cálculos basados en el movimiento de la luz en lugar de los electrones. El nuevo sistema es más de 100 veces más eficiente energéticamente que las computadoras digitales de última generación actuales para el aprendizaje automático y 25 veces más potente en densidad informática.
Además, señalan "sustancialmente varios órdenes de magnitud más para mejoras futuras". Esto, añaden los científicos, "abre una vía para que los procesadores optoelectrónicos a gran escala aceleren las tareas de aprendizaje automático desde los centros de datos hasta los dispositivos de borde descentralizados". En el futuro, dispositivos pequeños como los teléfonos móviles podrán ejecutar programas que sólo pueden calcularse en centros de datos masivos.
Los modelos masivos de aprendizaje automático que imitan el procesamiento de información del cerebro son la base de redes neuronales profundas (DNN) como la que impulsa ChatGPT. Si bien el aprendizaje automático se está expandiendo, las tecnologías digitales que impulsan las DNN actuales se están estancando. Además, a menudo solo se encuentran en centros de datos muy grandes debido a sus extremas necesidades energéticas. Esto está impulsando la innovación en la arquitectura informática.
La disciplina de la ciencia de datos está evolucionando debido al auge de las redes neuronales profundas (DNN). En respuesta a la expansión exponencial de estas DNN, que está poniendo a prueba las capacidades del hardware informático tradicional, las redes neuronales ópticas (ONN) han evolucionado recientemente para ejecutar tareas DNN a altas velocidades de reloj, en paralelo y con una mínima pérdida de datos. La baja eficiencia de conversión electroóptica, las enormes huellas de los dispositivos y la diafonía de canales contribuyen a una baja densidad de cálculo en los ONN, mientras que la falta de no linealidad en línea provoca un retraso significativo. Los investigadores han demostrado experimentalmente que un sistema ONN multiplexado espacio-temporal puede abordar todos estos problemas a la vez. Utilizan codificación de neuronas utilizando matrices de escala micrométrica de láseres emisores de superficie de cavidad vertical (VCSEL), que se fabrican en grandes cantidades y muestran una excelente conversión electroóptica.
Por primera vez, los investigadores proporcionan un pequeño diseño que aborda estos tres problemas a la vez. La teledetección LiDAR moderna y la impresión láser utilizan esta arquitectura, que se basa en matrices de láseres emisores de superficie verticales (VCSEL). Estas medidas parecen una mejora de dos órdenes de magnitud en el futuro cercano. El procesador optoelectrónico ofrece nuevas oportunidades para acelerar los procesos de aprendizaje automático en infraestructuras centralizadas y distribuidas.
Revisar laPapelyBlog . Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte.nuestro SubReddit de 27k+ ML,Canal de discordia, yBoletín electrónico, donde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.
Dhanshree Shenwai es ingeniero en informática y tiene una buena experiencia en empresas de tecnología financiera que abarcan el ámbito financiero, tarjetas y pagos y banca con un gran interés en las aplicaciones de IA. Le entusiasma explorar nuevas tecnologías y avances en el mundo en evolución de hoy que facilita la vida de todos.
PapelBlognuestro SubReddit de 27k+ MLCanal de discordiaBoletín electrónico