NSF Haberler

Araştırma bilgi işlem ekibi süper bilgisayar güvenilirliğini araştırıyor

Özellikle bulaşıcı hastalık modellemesi gibi yeni veriler elde edildikçe sık sık yeniden çalıştırılması gereken projeler için zorlu hesaplamalar yapan araştırmacılar, mümkün olduğunca az yazılım hatasıyla verimli bir şekilde çalışacak süper bilgisayarlara güveniyor.

Elektrik ve bilgisayar mühendisi Saurabh Bagchi liderliğindeki yakın tarihli bir projenin odak noktası, bazı işlerin neden başarısız olduğunu ve süper bilgisayarları daha güvenilir hale getirmek için neler yapılabileceğini anlamaktır. Purdue Üniversitesi.

Yaklaşık 5 yıl önce başlayan ve Türkiye’nin de desteklediği proje, Ulusal Bilim VakfıPurdue’daki süper bilgisayar sistemlerinin yanı sıra Urbana-Champaign’deki Illinois Üniversitesi ve Austin’deki Texas Üniversitesi’nden gelen verileri analiz etti.

Sonuçlar arasında:

  • Düğüm paylaşımı, daha yüksek oranda iş başarısızlığı anlamına gelmez.
  • Yoğun bellek kullanan uygulamalar, düğümün derecelendirilmiş belleğine ulaşılmadan önce bile başarısız olabilir, bu da uygulamaların bellek kullanımının yakından izlenmesinin gerekli olabileceğini düşündürür.
  • Bir kümenin boyutu büyüdükçe “uzak” kaynakların (paralel dosya sistemleri ve depolama sistemlerine ağ bağlantıları gibi) dikkatli bir şekilde tahsis edilmesi ve ölçeklendirilmesi önemlidir.

Bagchi, bunların süper bilgisayar sistem yöneticilerinin uygulamaları bilgisayarlarında daha güvenilir bir şekilde çalıştırmasını sağlamak için uygulayabilecekleri pratik çıkarımlar olduğunu söylüyor.

Ekip bulguları önümüzdeki günlerde sunacak. Güvenilir Sistemler ve Ağlar konferansısanal olarak Haziran ayında yapılacak.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir