Te dane to ukryte bogactwo. Naukowcy z PW trenują na nich AI

by Leszek Sadkowski

Około 40 tys. obrazów tomografii komputerowej płuc opracowanych przez zespół badawczy MI².AI z Politechniki Warszawskiej we współpracy w Polską Grupą Raka Płuca zostało wykorzystanych w projekcie Xlungs. W efekcie powstał model sztucznej inteligencji oparty na największej tego typu bazie danych na świecie, który będzie mógł wspierać lekarzy w szybszym i skuteczniejszym diagnozowaniu chorób. Co ciekawe, podobnych “uśpionych” zasobów może być w Polsce dużo więcej.

Każdego roku w Polsce wykonuje się kilkaset milionów badań laboratoryjnych z czego ponad 60 mln przypada na badania obrazowe takie jak m.in. tomografia komputerowa (TK). Wg. raportu Collective Minds Radiology w trakcie jednego badania TK powstaje od 200 MB do 1 GB danych.

Elektroniczna dokumentacja medyczna

Szacuje się, że średniej wielkości szpital generuje od kilkudziesięciu terabajtów (1 TB = 1024 GB) do kilku petabajtów (1 PB = 1024 TB) danych rocznie w postaci skanów obrazowych, wyników laboratoryjnych i dokumentacji medycznej.

W Polsce od ponad dekady budowana jest EDM, czyli elektroniczna dokumentacja medyczna – zintegrowany system gromadzący dane zdrowotne pacjenta. Od 1 lipca 2021 każdy lekarz czy gabinet ma obowiązek raportowania w nim zdarzeń medycznych. Jednak już wcześniej wiele placówek medycznych gromadziło takie dane na własną rękę.

Marcin Luckner, kierownik prac deweloperskich w projekcie Xlungs:

Często mamy do czynienia z sytuacją, kiedy leczenie pacjenta dobiegło już końca, a wyniki jego badań nadal są w bazie szpitala czy kliniki i metaforycznie “kurzą się” na półkach.

Jednak nawet jeśli dla danego przypadku zachorowania zebrane dane nie mają już zastosowania, to zestawienie ich z wynikami innych osób zmagających się z tą samą dolegliwością może pozwolić lekarzom dostrzec pewne wzory i prawidłowości w rozwoju choroby i w przyszłości usprawnić jej leczenie.

Taka analiza setek czy tysięcy wyników badań jest bardzo żmudnym i czasochłonnym działaniem, ale mogą nas w tym wesprzeć algorytmy sztucznej inteligencji.

Trenowanie AI w projekcie Xlungs

Naukowcy z zespołu Politechniki Warszawskiej nawiązali współpracę z Dziecięcym Szpitalem Klinicznym w Warszawie i Polską Grupą Raka Płuca (PGRP), w ramach której uzyskali dostęp do danych do celów badawczych. W ten sposób możliwe stało się wykorzystanie ok. 40 tys. płyt CD z tomografii komputerowej polskich pacjentów z lat 2010-2018, m.in. z badań przesiewowych w kierunku raka płuca, do przeprowadzenia treningu AI.

W ten sposób stworzono model sztucznej inteligencji 'CTSegMate’ oparty na największej na świecie – 40 TB – bazie zdjęć klatki piersiowej. Zespół MI².AI pracował nad jego stworzeniem przez trzy lata, a zaangażowane do tego zadania procesory potrzebowały ponad 180 000 godzin obliczeń.

Realizacja takiego projektu była możliwa dzięki finansowaniu przez Narodowe Centrum Badań i Rozwoju w ramach konkursu INFOSTRATEG I. Powstałe dzięki temu narzędzie usprawnia analizowanie zmian chorobowych w obrębie klatki piersiowej dzięki algorytmom sztucznej inteligencji.

Przemysław Biecek, kierownik projektu i lider zespołu MI2.AI:

System jest tak zaprojektowany by wspierać lekarza przy najbardziej żmudnych czynnościach i dać mu więcej czasu na analizę istotnych diagnostycznie cech.

Szukając podobnych obrazów system może szybko przejrzeć tysiące referencyjnych badań tomografii komputerowej, w każdym badaniu błyskawicznie analizuje setki zdjęć po to by precyzyjnie oznaczyć zmiany chorobowe oraz zwymiarować istotne cechy anatomiczne.

Cechy anatomiczne zmierzone przez system mogą być zintegrowane z innymi procesami diagnostycznymi. Podobnie jak badanie krwi jest podstawą diagnozowania licznych chorób, tak precyzyjne, szybkie i tanie wymiarowanie zmian w klatce piersiowej może być przełomem w screeningu.

Narzędzie to można zintegrować z już wykorzystywanymi w leczeniu systemami, gdyż współpracuje z powszechnie przyjętymi standardami dokumentacji medycznej.

Inwestycja w opracowanie danych

Warto dodać, że naukowcy z Politechniki Warszawskiej oceniają, że Polska, gdzie co roku przybywa kilkanaście tysięcy absolwentów informatyki i co roku wystawia się pół miliarda e-recept, ma spore predyspozycje, aby stać się potentatem w tworzeniu technologii medycznych wspieranych AI.

Polskie dane pozwalają lepiej wspierać lokalną diagnostykę niż dane pozyskane np. z Chin. Równocześnie ich rozmiar daje potencjał do tworzenia rozwiązań na światowym poziomie – podsumowuje Marcin Luckner.

***

MI².AI to zespół badawczy zajmujący się data science i uczeniem maszynowym. Tworzą go pracownicy naukowi i studenci dwóch wiodących wydziałów matematyki i informatyki w Polsce: MIM Uniwersytetu Warszawskiego i MiNI Politechniki Warszawskiej. Zajmuje się prowadzeniem badań naukowych z dziedziny sztucznej inteligencji jak również praktycznym zastosowaniem ich efektów oraz popularyzacją wiedzy z obszaru swojej ekspertyzy.

Możesz również lubić