LIBRISTO
LIBROAMANTO
obowiązkowe
Zostań członkiem wspólnoty miłośników książek z całego świata i zyskaj mnóstwo korzyści. Załóż konto bezpłatnie
0
Darmowa dostawa z usługą Inpost oraz Orlen od 299.00 zł
DPD Kurier 12.99 Poczta Polska 18.99 Paczkomat 13.99 InPost 12.99 Punkt DPD 13.99

Darmowa dostawa dla zamówień powyżej 299,00 zł.

HPC Observability

Production Monitoring, Profiling, and Site Reliability for Linux Clusters, GPUs, and Parallel Storage at Scale

Język AngielskiAngielski
Książka Miękka
Książka HPC Observability M. Edwards
Kod Libristo: 52747456
Wydawnictwo Independently published, maj 2026
HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance... Cały opis
? points 46 b Nowość Nowość
81.09
Zapowiedź Wydanie 02. 06. 2026

30 dni na zwrot towaru

HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance computing systems running reliably at scale. It brings together the operational knowledge scattered across vendor documentation, conference papers, and forum threads into a practical framework for turning HPC telemetry into actionable insight.

Modern HPC environments - Slurm clusters, GPU-dense AI systems, Lustre and GPFS storage, InfiniBand and Slingshot fabrics - generate more data than any team can manually interpret. The result is wasted node-hours, failed simulations, hidden storage bottlenecks, fabric congestion, and GPU failures that surface only after days of runtime.

This book provides a complete operational approach to HPC observability through a five-layer model covering hardware, operating systems, schedulers, applications, storage, and networks. Readers learn how to build metrics pipelines for clusters from hundreds to tens of thousands of nodes; monitor GPUs with DCGM; profile MPI and OpenMP applications with PAPI and Score-P; diagnose storage and network slowdowns; create useful dashboards and alerts; and run effective incident response and post-mortems.

Drawing on peer-reviewed research and real production experience, the book includes original diagrams, practical workflows, reference material, Prometheus alert examples, and a step-by-step lab environment for learning on a laptop.

Written in the voice of a senior HPC engineer rather than an academic text, HPC Observability assumes readers already understand the fundamentals and focuses instead on the operational realities of running large-scale Linux, AI, and research-computing infrastructure.

Aktorka & Poliglotka
EWA KASP dla
Odtworzyć wideo
Ewa Kasp
Libristo ma największy wybór literatury obcojęzycznej. Dlatego tutaj kupuję swoje książki.

Informacje o książce

Pełna nazwa HPC Observability
Autor M. Edwards
Język Angielski
Oprawa Książka - Miękka
Data wydania 2026
Liczba stron 164
EAN 9798198765443
Kod Libristo 52747456
Waga 397
Wymiary 216 x 280 x 9
Podaruj tę książkę jeszcze dziś
To łatwe
1 Dodaj książkę do koszyka i wybierz „dostarczyć jako prezent” 2 W odpowiedzi wyślemy Ci bon 3 Książka dotrze na adres obdarowanego

Logowanie

Zaloguj się do swojego konta. Nie masz jeszcze konta Libristo? Utwórz je teraz!

 
obowiązkowe
obowiązkowe

Nie masz konta? Zyskaj korzyści konta Libristo!

Dzięki kontu Libristo będziesz mieć wszystko pod kontrolą.

Utwórz konto Libristo
Doradca książkowy Libroamiko
Cześć, jestem Libroamiko, w czym mogę pomóc?