Las fronteras informáticas de los aceleradores

T.E.L: 2 min. 12 seg.

Los colosales aceleradores de partículas que monitorean las colisiones en el Tevatron de Fermilab y el Gran Acelerador de Hadrones en CERN no sólo imponen nuevos desafíos a la física, sino también a la consulta de datos de sus sistemas.
CMS CERN

Los científicos de los experimentos CMS y ATLAS en CERN están usando un sistema llamado FroNTier, originalmente diseñado por la división computación de Fermilab para el experimento CDF. El sistema ayuda a los investigadores a distribuir la información necesaria para interpretar las colisiones, a la velocidad de la luz.

La velocidad de las consultas es crucial, así como su actualización. "Ni los más rápidos servidores de bases de datos pueden cerrar la brecha física entre sitios geográficamente dispares", señaló John DeStefano, ingeniero de RHIC y ATLAS.

Hits semanales Frontier

Los científicos de Fermilab, Jim Kowalkowski y Marc Paterno tuvieron la idea original de Frontier. Y un grupo que había ganado experiencia con un sistema similar diseñado para el experimento DZero trabajó para implementar las ideas en CDF. Finalmente, otro grupo contribuyó para probar el sistema.

El desafío no es menor. Todos los científicos necesitan cargar los datos para analizar los resultados de las colisiones. No se monitorean los detectores en cada colisión individual, sino a intervalos. En el detector CDF, los haces de protones y antiprotones cruzan sus caminos 1.7 millones de veces por segundo y se planea elevar el número a 3 millones por segundo para CMS y ATLAS cuando el LHC esté en su máximo esplendor.

El servidor FroNTier toma la información de los cambios en los datos de la base del detector y la envía a otros servidores alrededor del mundo que cachean la información y la comparten con otras computadoras. Así, sólo FroNTier necesita solicitar actualizaciones del mapa de datos de la base, según informa iSGTW.

CMS Frontier

Estadísticas de cmsfrontier1

El sistema FroNTier usa HTTP, el mismo lenguaje que esta página usa para comunicarse con su navegador web, para enviar pedidos a la base de datos. Esto permite un gran número de usuarios. Utiliza la arquitectura REST y Squid.

Gracias a una reciente actualización por Dave Dykstra, ingeniero de Fermilab que ahora lidera el proyecto FroNTier, el sistema ahora pierde menos tiempo y poder computacional al saltearse el paso de recargar la información si el mapa de datos del detector no cambió.

El nombre FroNTier proviene de N Tier, donde N es un número y Tier hace referencia a lo que podríamos llamar Nodos. La base de datos central está en Tier 0 que distribuye los datos a todos los Tier 1, 2 y 3, alrededor del mundo.

Arquitectura Frontier CMS

La arquitectura FroNTier en CMS.
Aquí se ve una diagrama con una parte online y otra offline. La primera es la parte del sistema co-localizada con el detector CMS. La segunda empieza en CERN y envía los datos al mundo.
Squid es el nombre del programa de cacheo http y Tomcat es el nombre del sistema en el que FroNTier está creado. Las aplicaciones en los Tier hacen consultas a la base de datos que son convertidas en http por el cliente Frontier. Luego Squids devuelve los resultados inmediatamente de su caché o envía los resultados a los servidores Frontier que convierten las consultas de http a consultas de bases de datos y los resultados en http.

Fuentes y links relacionados

Frontier guides computing through the collision landscape, por Kathryn Grim

Sobre las imágenes

Primeros eventos de CMS a 7 TeV. Crédito: CMS/CERN

Etiquetas:
Computación en Blogalaxia-Ciencia en Bitácoras.com

1 comentario:

jormarcha04:28
Respecto al artículo 
Las fronteras informáticas de los aceleradores
La gráfica (hit semanales) que se muestra es tráfico de red (en verde la entrada de datos) creo que hace referencia a al Tier 0 y este distribuye al resto de nodos.
Me parece un tráfico mínimo (picos de 124kb) cuando imagino que las comunicaciones serán de Gigas como mínimo o Teras para el ancho de banda .....

A parte, se habla de programas como squid y tomcat ambos software libre.
incluso mrtg (el de la primera gráfica).
Me resulta extraño que la comunidad científica utilice este tipo de aplicaciones (desarrolladas por ¿¿??) para el análisis y la transmisión de tantos millones de datos. No digo que no sean fiables (yo los uso), simplemente me choca.

Increíble blog, me encanta, un saludo
ResponderBorrar
Respuestas

Agregar un comentario

Páginas

7/5/10 - DJ: