Estudiante de 18 años sorprende a los científicos al mapear 1,5 millones de objetos espaciales previamente desconocidos

Matteo Paz
Matteo PazMontaje

Matteo Paz creó un algoritmo de aprendizaje automático utilizando matemáticas avanzadas para analizar variaciones de luz sutiles en un archivo de datos inmenso.

Matteo Paz, un estudiante de secundaria de EEUU, logró identificar más de 1,5 millones de objetos espaciales que habían pasado desapercibidos para la comunidad científica durante más de una década.

El hallazgo no se ha producido mediante nuevas observaciones telescópicas, sino a través del procesamiento de datos archivados de la misión NEOWISE de la NASA mediante inteligencia artificial.

Este trabajo demuestra que la aplicación de algoritmos modernos sobre bases de datos antiguas tiene el potencial de revelar información crítica que la tecnología anterior no pudo detectar.

Cabe señalar que la investigación ha superado la revisión por pares y ha sido publicada oficialmente en The Astronomical Journal, validando su rigor científico, por lo que es un verdadero hito.

El desafío de procesar 200.000 millones de filas de datos

El origen de este descubrimiento reside en la misión NEOWISE, lanzada en 2009 con el objetivo principal de detectar y rastrear asteroides cercanos a la Tierra.

Mientras el telescopio escaneaba el cielo en busca de rocas espaciales, sus sensores infrarrojos recopilaron ininterrumpidamente información del fondo cósmico. Esto generó un archivo masivo que contiene aproximadamente 200.000 millones de filas de observaciones.

Este volumen de información se convirtió, paradójicamente, en un obstáculo. Y es que la cantidad de datos era inmanejable para cualquier comprobación manual por parte de los astrónomos.

Además, el software de análisis de la época estaba calibrado para detectar objetos con movimientos o características muy específicas, pasando por alto millones de fuentes de luz que presentaban patrones irregulares.

Es importante destacar que esos datos quedaron almacenados en servidores sin ser estudiados por la agencia espacial, acumulando polvo, hasta ahora.

Utilizó matemáticas avanzadas

Durante su participación en la Planet Finder Academy, un programa de verano asociado a Caltech, Paz decidió abordar este problema de Big Data utilizando matemáticas avanzadas en lugar de observación directa.

Bajo la tutela del científico Davy Kirkpatrick, diseñó un algoritmo de aprendizaje automático capaz de digerir el archivo masivo. La clave del éxito fue la implementación de transformadas de Fourier y análisis de wavelets.

Estas herramientas matemáticas permiten descomponer señales complejas basadas en el tiempo. Al aplicarlas al archivo de la NASA, el algoritmo pudo filtrar el ruido de fondo y aislar fuentes de luz que cambiaban de intensidad de manera tenue o en intervalos de tiempo que el ojo humano o los programas antiguos no percibían.

El modelo matemático para detectar anomalías
El modelo matemático para detectar anomalíasThe Astronomical Journal

En solo seis semanas, el estudiante construyó una tubería de procesamiento de datos que automatizó la detección de estas anomalías y desveló que los 1,5 millones de objetos catalogados no son errores del sistema, sino fenómenos astrofísicos reales.

El algoritmo identificó una vasta colección de estrellas variables, cuásares activos, supernovas y sistemas binarios.

Al clasificar estas fuentes según sus cambios de brillo a lo largo del tiempo, el catálogo ofrece ahora un mapa detallado de la actividad energética del universo que antes aparecía como espacio vacío.

De hecho, el catálogo generado por Paz ya se está utilizando como herramienta de referencia para dirigir los instrumentos de telescopios de vanguardia, como el Observatorio Vera Rubin y el telescopio espacial James Webb.

Estos observatorios pueden ahora apuntar directamente a coordenadas específicas donde se sabe que existe actividad variable, optimizando su valioso tiempo de observación.

Una tecnología aplicable a las finanzas o la medicina

El algoritmo desarrollado por este estudiante va más allá de la astronomía. Y es que la base del código no es el conocimiento estelar, sino el análisis de series temporales.

La capacidad de detectar fluctuaciones sutiles en conjuntos de datos masivos hace que esta tecnología sea transversal.

Es decir, la misma lógica matemática que ha encontrado cuásares ocultos podría aplicarse para predecir micromovimientos en los mercados financieros, monitorizar cambios imperceptibles en patrones climáticos o detectar anomalías tempranas en escáneres cerebrales y datos neurológicos.

La próxima frontera de la ciencia no depende solo de construir sensores más grandes, sino de desarrollar inteligencias artificiales capaces de interrogar con mayor eficacia a los datos que ya se tienen.

Más información sobre: