Son yıllarda, doğrudan tüketiciye yönelik genetik test pazarı patladı. Evde DNA testi kullanan insanların sayısı 2017’de iki kattan fazla arttı, bunların çoğu ABD’de. 25 Amerikalı yetişkinden yaklaşık 1’i artık atalarını biliyor.
Testler daha popüler hale geldikçe, şirketler biriken verilerin nasıl saklanacağı ve sonuçların nasıl hızlı bir şekilde işleneceği ile boğuşuyor. Purdue Üniversitesi’ndeki bilgisayar bilimcileri tarafından oluşturulan TeraPCA adlı yeni bir araç artık yardıma hazır. Sonuçlar dergide yayınlandı biyoinformatik. Araştırma, NSF’nin Bilgisayar ve Bilişim Bilimi ve Mühendisliği Müdürlüğü tarafından finanse ediliyor ve büyük veri analitiğinde yeni görüşleri destekliyor.
Pek çok fiziksel farklılığımıza rağmen, herhangi iki insan genetik olarak yaklaşık yüzde 99 oranında aynıdır. Bizi farklı kılan %1’e katkıda bulunan en yaygın genetik varyasyonlar, tek nükleotid polimorfizmleri veya SNP’ler (“snips” olarak telaffuz edilir) olarak adlandırılır.
Her insanın genomunda 4 ila 5 milyon SNP vardır. Bunlar, bir kişi hakkında bile takip edilebilecek çok fazla veri; aynı şeyi binlerce veya milyonlarca insan için yapmak oldukça büyük bir başarı.
En büyük genetik test şirketleri için, verileri depolamak ve işlemek yalnızca pahalı ve teknolojik açıdan zorlayıcı değil, aynı zamanda mahremiyet endişelerini de beraberinde getiriyor. Bu şirketlerin kişisel sağlık verilerini koruma sorumluluğu bulunmaktadır. Sabit disklerinde saklamak onları bilgisayar korsanları için çekici hedefler haline getirebilir.
TeraPCA şu zorluklar göz önünde bulundurularak tasarlanmıştır: tek seferde bir bilgisayarın ana belleğine sığamayacak kadar büyük verilerin işlenmesi. Bir seferde küçük parçaları okuyarak büyük veri kümelerini anlamlandırır. Gelecekte TeraPCA, yalnızca atalarınızı öğrenirken faydalı olmayabilir, aynı zamanda yeni genetik araştırmaları mümkün kılarak hastalık risklerine ve olası tedavilere ışık tutabilir.