Sağlıkta dönüşüm ve büyük veri uygulamaları

Sağlıkta büyük veri kaynakları dahili (elektronik tıbbi kayıtlar, klinik karar destek sistemleri, bilgisayarlı talimat girişi) ve harici (devlet kaynakları, laboratuvarlar, eczaneler, sigorta kurumları/şirketleri vs.)  olabilir. Genellikle farklı formatlardadır ve farklı konumlarda bulunurlar. Veri tip ve kaynaklarına örnek olarak aşağıdaki başlıklar sunulabilir;

1. Web ve sosyal medya: Facebook, Twitter, LinkedIn, bloglar gibi kaynaklarla etkileşim. Sağlık kurumlarının web sitelerini ve akıllı telefon uygulamalarını içerebilir.

2. Makine-makine verisi: Sensörler, ölçüm aygıtları ve diğer yaşamsal bulgu cihazlarından alınan veriler.

3. Büyük işlem verisi: Sağlık provizyon talebi ve diğer faturalama kayıtları yapılandırılmış yada yapılandırılmamış (metin) şekilde bulunmaktadır.

4. Biyometrik veri: Parmak izi, genetik, el yazısı, retinal tarama, röntgen ve diğer tıbbi görüntüler, kan basıncı, nabız, puls-oksimetre okumaları vs tip veriler.

5. İnsan üretimi veriler: Elektronik sağlık kayıtları, hekim notları ve kağıt belgeler gibi yapılandırılmış yada yapılandırılmamış veriler.

Sağlıkta büyük veri analitiklerinin kullanım alanları

4. Kanıta dayalı tıp: Çeşitli yapılandırılmış veya yapılandırılmamış tıbbi, finansal, operasyonel, klinik ve genomik verileri birleştirip analiz ederek sonuçlarla tedavileri eşleştirmek, hastalık veya yeniden başvuru riski taşıyan  hastaların belirlenmesi ve daha verimli bakım sağlanması.

5. Genomik analitikler: Daha verimli ve maliyet etkin gen dizileme ile genom analizi gündelik tıbbi karar sürecinin parçası haline getirmek.

6. Öngörüsel hile analizi: Hile, gereksiz veya kötü kullanımı azaltmak için çok sayıda provizyon isteğini hızlı şekilde analiz etmek.

7. Uzaktan takip: Güvenlik takibi veya yan etki tahmini için hastanede veya evde bulunan aygıtlardan eş zamanlı çok ve hızlı veri almak ve analiz etmek.

8. Hasta profil analitikleri: Hasta profillerine segmentasyon ve prediktif modelleme gibi ileri analitik teknikleri uygulayarak proaktif bakım veya yaşam değişikliğinden yararlanabilecek hastaları belirleme (örnek olarak diabet gibi bir hastalığa yakalanma riski olanlardan istifade edebilecek olanlara önleyici bakım uygulanması)

Özetle, büyük veri analitikleri ile veriler ve örüntüler arasındaki ilişki ve eğilimler anlaşılarak ve keşfedilerek bilinçli kararlar verilebilir, bakım kalitesinin artırılması ve maliyetlerin azaltılması sağlanabilir. Sağlıkta büyük veri analitikleri potansiyeli için çok çeşitli senaryolar sunulabilir. Hasta özellikleri, maliyet ve bakım sonuçları analiz edilerek klinik olarak en maliyet etkin çözümler tanımlanabilir, buna yönelik analiz ve araçlar sunulabilir.

Büyük veri teknolojileri

Büyük veri projelerindeki kavramsal çerçeve geleneksel sağlık bilişimi veya analitik projelerle hemen hemen aynıdır. Aradaki fark ise projenin nasıl yürütüleceğiyle ilgilidir. Sıradan sağlık analitiklerinde analiz bir masaüstü yada diz üstü bilgisayara yüklenen iş zekası araçları ile gerçekleştirilebilirken, büyük veride süreç çoklu işlem düğümlerine bölünerek yürütülür. Aslında dağıtık işleme kavramı yıllardır mevcuttur. Yeni olan bunun büyük veri kümelerinde daha doğru kararlara yönelik bilgiler üretmek için kullanımıdır. Hadoop/MapReduce gibi bulut ortamında mevcut açık kaynak platformları sağlık alanında büyük veri uygulamalarını teşvik etmektedir.

Geleneksel analitik araçlarla karşılaştırıldığında büyük veri analitiklerinde algoritmalar ve modeller benzeşirken, geleneksel araçların kullanıcı dostu arayüzleri büyük veri analitiklerinde tamamen farklılaşmaktadır. Büyük veri  analitik araçları oldukça karmaşık, programlama yoğun ve çeşitli becerilerin uygulanmasını gerektiren araçlardır.

Büyük veri analitikleri için ilk aşama hedeflenen verilerin bir havuzda toplanmasıdır. İkinci aşamada ham veri işlenir yada dönüştürülür. Bunda da çeşitli seçenekler mevcuttur. Web servislerle (middleware) beraber servis yönelimli (service-oriented) mimari yaklaşım bir seçenektir. Burada veri hâlâ ham kalır ve servisler  veriyi çağırmak ve işlemek için kullanılır. Bir diğer yaklaşım verinin farklı kaynaklardan toplanarak bütünleştirildiği ve sonra işlemeye hazır hale getirildiği veri ambarları olabilir. Bunlar da eş zamanlı olamazlar. Özümleme, dönüştürme ve yükleme (extract, transform, and load, ETL) basamakları ile farklı kaynaklardan alınan veriler temizlenir ve hazır hale getirilir. farklı kaynaklardan alınan verinin yapılandırılmış veya yapılandırılmamış olmasına göre büyük veri analitikleri platformuna farklı veri türleri girdi olabilir.

Sonrasında, veri toplama yaklaşımı, dağıtık tasarım, araç seçimi, analitik modeller açısından çeşitli kararlar alınmalıdır. Sonuçta sağlıkta büyük veri uygulamalarında sorgular, raporlar, OLAP ve veri madenciliği olarak dört tipik uygulama görülür. Görselleştirme bu dört uygulama sonrasındaki unsurdur.

Büyük veri analitiklerinde en bilinen büyük veri analitikleri platformu açık kaynak dağıtık veri işleme platformu olan Hadoop (Apachee platformu)’dur. CouchDB ve MongoDB ile beraber NoSQL teknolojileri sınıfında yer alan Hadoop potansiyel olarak çok büyük veri kümelerini çok sayıda sunucuya (düğüm) bölüştürüp burada çözülen parçaları sonuçta birleştirerek çalışmaktadır. Hem veri organizasyonu hem de analizinde iş görebilir. Avantajlarına rağmen kurulum, konfigürasyon ve yönetimi zor olabilir. AWS, Cloudera, Hortonworks ve MapR Technologies gibi çeşitli satıcılar açık kaynak Hadoop platformları dağıtmaktadır. Ayrıca IBM BigInsights gibi ticari seçenekler de mevcuttur.

Sağlıkta büyük veri metodolojisi

Sağlıkta büyük veri metodolojisi için dört basamaklı bir çerçeve önerilmektedir.

1. Kavramsal çalışma: Öncelikle farklı disiplinlerden uzmanlardan oluşan büyük veri analitikleri takımı bir “kavramsal açıklama” geliştirir. Sağlıkta büyük veri analitikleri projesi için gerekçe veri büyüklük, hız, çeşitlilik ve doğruluğu (4V) açısından belirlenmelidir. Farklı çözümlerin birbirine göre maliyet ve etkinliği değerlendirilmelidir.

2. Öneri geliştirme: Bu aşamada kavramsal çalışmaya dayalı olarak “Çözülecek problem nedir?”, “Niçin önemli ve ilginçtir?”, “Niçin büyük veri analitikleri kullanılmalı?” gibi soruların cevapları aranır. Büyük veri analitiklerinin maliyet ve karmaşıklığı geleneksel yaklaşımlardan oldukça fazladır. Bu yüzden bu sorgulama önem taşımaktadır. Ayrıca, proje ekibi daha önce bu konuda yapılan proje ve araştırmalar hakkında da bilgi sağlamalıdır.

3. Metodoloji: Kavramsal tanımlama detaylandırılarak alt aşamalara bölünür. Bu arada bağımlı ve bağımsız değişkenler tanımlanır. Veri kaynakları belirlenir. Veriler analitik evreye hazırlanmak üzere depolanır, tanımlanır ve dönüştürülür. Bu aşamada en önemli konulardan birisi de kullanılacak platform ve araçların seçimidir. Sonrasında çeşitli bütük veri teknikleri verilere uygulanır. Bir seri analiz ve tekrardan sonra büyük veri analitiklerinden çeşitli öngörüler elde edilir. Bu öngörüler bilgiye dayalı kararın temeli olacaktır.

4. Test ve değerlendirme: Bu aşamada modeller ve bunların bulguları test edilerek değerlendirilir ve eylem için paydaşlara sunulur.

Sonuç

Sağlıkta büyük veri ile ilgili olarak çok sayıda zorluk da söz konusudur. Öncelikle veriler çoğunlukla farklı ortamlarda dağıtık şekilde depolanmaktadır ve birbirleri ile entegre değildir. Büyük veri analitikleri kapsamında güvenlik ve mahremiyetle ilgili problemlerin doğası ve boyutu da değişmektedir. Kimliksizleştirme bir zorunluluk olarak görülmekteyse de bunun çeşitli bilgilerin elde edilmesinde (yeniden başvuru oranı gibi) problemlere yol açtığı bilinmektedir. Ayrıca pazar rekabetine ilişkin kıymetli bilgiler sağlayabildiğinden veri paylaşımı konusunda farklı paydaşlar gönülsüz davranabilmektedir. Sonuçta, çözümlerin hasta verilerinin güvenliği ile veri bütünlük ve kullanılabilirliği arasında uygun bir denge sağlaması gerekmektedir.

Yenilikçi teknolojilerin veri toplama, depolama, işleme alanlarında sağladığı teknolojik imkan ve kabiliyetler, sağlıkta bilgi üretimi ve uygulamaya dahil edilmesi süreçlerini dramatik olarak değiştirmeye adaydır. Ancak dönüşümün sadece teknolojik alt yapı olarak değil, kültür, değer, liderlik ve organizasyonel yapılanmayı da içerecek şekilde projelendirmesi gerekecektir.

Son olarak bir önceki yazımızdaki vurguyu tekrar hatırlatalım; birey, makine ve veri ilişkisini süreklilik içerisinde tesis eden dördüncü sanayi devrimi çağında, öğrenen sağlık sistemi tesis edilmeden ve “veriye dayalı” yaklaşımlarla eyleme yönelik (actionable) bilgi üreticisi olmayı beceremeden sağlık alanında rekabet edebilmek çok zor görünmektedir.

Önerilen ilave okumalar:

Dördüncü sanayi devrimi (4): Sağlık alanında fırsatlar

Öğrenen sağlık sistemi ve dördüncü sanayi devrimi

Veri bilimci olmak

Veri bilimci nasıl olunur? [İnfografik]

Sağlıkta büyük verinin kullanımı

Kaynaklar:

5. Hansen MM, Miron-Shatz T, Lau AY, Paton C. Big Data in Science and Healthcare: A Review of Recent Literature and Perspectives. Yearb Med Inform. 2014 Aug 15;9:21-6. Erişim Tarihi: 18 Şubat 2016.

6. Braunstein, Mark L. Health Big Data and Analytics. in: Practitioner’s Guide to Health Informatics. Springer International Publishing, Switzerland, 2015.