CMS przetestował nową metodę "eksploracji danych" • Igor Ivanov • Wiadomości naukowe na temat "Elementów" • Metody przetwarzania danych, detektor CMS, technologie akceleracji i detekcji

CMS wypróbował nową inteligencję danych

Górne ograniczenia stałej sprzężenia hipotetycznego ciężkiego bozonu Z 'Brozpadające się na hadrony. Czarna linia – Wyniki CMS uzyskane przy użyciu metody "danych wywiadowczych". Krzywe o różnych kolorach – Wyniki różnych eksperymentów z tradycyjnym zestawem statystyk. Obraz z omawianego artykułu

Tempo zderzeń protonów w Wielkim Zderzaczu Hadronów jest tak wysokie, że detektory dosłownie balansują do punktu, w którym nie umierają w strumieniu danych. Zderzenia wiązek protonów występują dziesiątki milionów razy na sekundę. Każda z nich prowadzi do kilkudziesięciu pojedynczych zderzeń proton-proton, aw rezultacie do narodzin setek cząsteczek. Każde takie zdarzenie pozostawia odpowiedź w wykrywaczu, który po cyfryzacji "waży" kolejność megabajtów. Oczywiste jest, że przesyłanie i nagrywanie całego tego strumienia danych – a to byłoby wiele terabajtów na sekundę – jest po prostu nieosiągalne.

W rzeczywistości wszystkie te dane nie są rejestrowane. Zdecydowana większość zderzeń to "nudna" fizyka hadronowa, która była już badana bardzo szeroko, zarówno w poprzednich akceleratorach, jak iw LHC już w pierwszych sesjach pracy.Główne zainteresowanie reprezentują stosunkowo rzadkie zdarzenia narodzin ciężkich cząstek lub sztywne procesy o dużych pędach poprzecznych. Skala rzadkości procesów dostępnych do badania w LHC została opisana w popularnym artykule Rarities of the Microworld.

W nowoczesnych detektorach istnieją specjalne urządzenia, wyzwalacze, które potrafią w minimalnym stopniu analizować każdą kolizję w locie i mówią, czy sensowne jest nagrywanie jej w celu dalszej analizy, czy nie (patrz sekcja "Sto tysięcy" w artykule "Anatomia jednej wiadomości"). System wyzwalaczy jest zwykle wielopoziomowy. Na przykład w detektorze CMS znajduje się główny wyzwalacz L1, – szybka elektronika, zbudowana zgodnie ze specjalną architekturą, która ma tylko czas na usunięcie najbardziej podstawowych danych z kalorymetrów i detektorów mionowych i informuje, czy nastąpiło znaczące uwolnienie energii, czy też nie. Jeśli L1 coś zobaczy, pomija to wydarzenie dalej.

Następnie uruchamia się wyzwalacz wysokiego poziomu HLT, który jest farmą z 13 000 procesorów. Fizycy już teraz stawiają pewne wymagania dotyczące wyboru zdarzeń, na przykład minimalny próg uwalniania energii.Jeśli wydarzenie nie spełnia tego kryterium, zostaje rzucone; jeśli to spełnia, zdarzenie jest digitalizowane całkowicie ze wszystkich komponentów detektora i zapisywane na nośniku. Przepływ zdarzeń w CMS, który przeszedł tę trudną dwustopniową selekcję, wynosi 400 zdarzeń na sekundę; To są statystyki, z którymi fizycy będą pracować później w trybie offline.

W tym schemacie pracy można zauważyć pewne "marnotrawstwo" mocy. Kiedy wyzwalacz HLT analizuje dane, wykonuje minimalną cyfryzację, w szczególności odzyskuje energię strumieni hadronów, ale ta informacja jest odrzucana. Dlatego w 2012 r. CMS Collaboration postanowił wprowadzić nową, równoległą metodę rejestracji danych, która została nazwana zbieranie danych ("inteligencja danych").

Mówimy o zachowaniu informacji o zdarzeniach, które nie spełniają kryteriów wyboru HLT, ale w których występuje również zauważalna aktywność hadronów. Przepływ takich zdarzeń osiąga tysiące na sekundę, a rejestrowanie ich w całości byłoby nieopłacalne. Można jednak rejestrować nie całą reakcję wykrywacza, ale tylko niewielką część informacji, która w rzeczywistości była używana podczas działania HLT. Wtedy objętość każdego zdarzenia będzie mniejsza o rząd wielkości, a dane te można zapisać bez problemów.

Znaczenie tej procedury jest takie, że nawet niekompletne informacje pozwolą fizykom na małą skalę "zbadać" ten obszar średniej energii, na który trudno spojrzeć w oparciu o zwykłe statystyki. Zwykle nie oczekuje się niczego, co nie byłoby widoczne przy wysokich energiach. Ale jeśli nagle odkryta zostanie anomalia, powiedzmy, nowy rezonans w czysto hadronowym kanale o masie kilkuset GeV, to fizycy w przyszłości będą w stanie rekonfigurować wyzwalacze i dokładniej zająć się tą anomalią.

Niedawno współpraca CMS wykazała pierwszy przykład wyniku uzyskanego przy użyciu takich danych (arXiv: 1604.08907). Analizowała ona zebrane równolegle statystyki w poszukiwaniu hipotetycznych rezonansów, które mogłyby rozbić się na dwa strumienie hadronów (patrz rysunek). Obszar niezmiennych mas objętych tymi statystykami zaczyna się od 400 GeV, co jest około dwukrotnie mniejszym niż w analizie zwykłych statystyk.

Nie znaleziono nowych rezonansów. Ale najważniejsze jest to, że ustalone ograniczenia właściwości tych rezonansów okazały się zauważalnie lepsze niż przy tradycyjnym wyborze danych. Dowodzi to, że technika działa dobrze i dlatego będzie stosowana w przyszłości.Popularną opowieść o nowej pracy można również znaleźć na blogu Tommaso Dorigo, członka współpracy CMS.


Like this post? Please share to your friends:

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: