Kilder til store data i medisin

Kilder til store data i medisin

En enkel definisjon av store data i medisin er "totaliteten av data knyttet til pasienthelse og velvære" (Raghupathi 2014). Men hva er disse typer data, og hvor kommer de fra?

Følgende er en bred oversikt over typer og kilder til store data av interesse for helsepersonell, forskere, betalere, beslutningstakere og næringsliv.

Disse kategoriene utelukker ikke gjensidig, fordi de samme dataene kan stammer fra en rekke kilder.

Denne listen er heller ikke uttømmende, fordi den praktiske anvendelsen av store dataanalyser sikkert vil fortsette å utvides.

Kliniske informasjonssystemer

Dette er tradisjonelle kilder til kliniske data som helsepersonell er vant til å se på.

Kravdata fra betalere

Offentlige betalere (f.eks. Medicare) og private betalere har store repositorier av kravdata på mottakerne. Noen helseforsikringsselskaper tilbyr nå også incentiver for å dele helsedataene dine.

Forskningsstudier

Forskningsdatabaser inneholder informasjon om studiedeltakere, eksperimentelle behandlinger og kliniske utfall. Store studier er vanligvis sponset av farmasøytiske selskaper eller myndigheter. En applikasjon av personlig medisin er å matche individuelle pasienter med effektive behandlinger, basert på mønstre i kliniske forsøksdata.

Denne tilnærmingen beveger seg utover å bruke bevisbaserte medisinprinsipper, hvorved en helsepersonell avgjør om en pasient deler brede karakteristika (f.eks. Alder, kjønn, rase, klinisk status) med prøvedeltakere. Med stor dataanalyse er det mulig å velge en behandling basert på mye mer granulær informasjon, for eksempel den genetiske profilen til pasientens kreft (se nedenfor).

Kliniske beslutningsstøttesystemer (CDSS) har også utviklet seg raskt og representerer nå en stor del av kunstig intelligens (AI) i medisin.

De bruker pasientdata for å hjelpe klinikere med sin beslutningsprosess og blir ofte kombinert med EHR.

Genetiske databaser

Lageret for menneskelig genetisk informasjon fortsetter å samle seg i et raskt tempo. Siden Human Genome Project ble fullført i 2003, har kostnaden for human DNA-sekvensering blitt redusert med en million ganger. Personal Genome Project (PGP), lansert i 2005 av Harvard Medical School, søker å sekvensere og publisere de komplette genomene på 100.000 frivillige fra hele verden. Selve PGP er et godt eksempel på stort dataprosjekt på grunn av det store volumet og mangfoldet av data.

Et personlig genom inneholder ca. 100 gigabyte data. I tillegg til sekvenseringsgenerene samler PGP også data fra EHR, undersøkelser og mikrobiome profiler.

En rekke selskaper tilbyr genetisk sekvensering direkte til forbrukere for helse, personlige egenskaper og farmakogenetikk på kommersiell basis.

Denne personlige informasjonen kan underkastes stor dataanalyse. For eksempel stoppet 23andMe å tilby helsemessige genetiske rapporter til nye kunder per 22. november 2013, for å overholde US Food and Drug Administration. Imidlertid begynte selskapet i 2015 å tilby visse helsekomponenter av deres genetiske spyttprøve igjen, denne gangen med FDAs godkjenning.

Offentlige poster

Regjeringen holder detaljert oversikt over hendelser knyttet til helse, som innvandring, ekteskap, fødsel og død. Den amerikanske folketellingen har samlet enorme mengder informasjon hvert 10. år siden 1790. Statens statistikkwebside hadde 370 milliarder celler fra 2013, med ca 11 milliarder kroner lagt til årlig.

Websøk

Websøkinformasjon samlet av Google og andre websøkleverandører kan gi sanntidsinnsikt relatert til befolkningens helse. Verdien av store data fra nettsøkemønstre kan imidlertid forbedres ved å kombinere den med tradisjonelle kilder til helsedata.

Sosiale medier

Facebook, Twitter og andre sosiale medier-plattformer genererer et rikt utvalg av data døgnet rundt, og gir en oversikt over plasseringene, helsemessige oppføringer, følelser og sosiale interaksjoner mellom brukerne. Anvendelsen av sosiale medier store data til folkehelsen har blitt referert til som digital sykdomsdeteksjon eller digital epidemiologi. Twitter, for eksempel, har blitt brukt til å analysere influensaepidemier blant befolkningen generelt.

Verdens velværeprosjekt som startet ved University of Pennsylvania er et annet eksempel på å studere sosiale medier for å forstå folks erfaring og helse bedre. Prosjektet samler psykologer, statistikere og datavitenskapere som analyserer språk som brukes når de samhandler på nettet, for eksempel når man skriver statusoppdateringer på Facebook og Twitter. Forskere ser på hvordan brukeres språk relaterer seg til helse og lykke. Fremskritt i naturlig språkbehandling og maskinlæring bidrar til deres bestrebelser. En fersk publikasjon fra University of Pennsylvania så på måter å forutsi psykisk lidelse ved å analysere sosiale medier. Det ser ut som at symptomer på depresjon og andre psykiske helseforhold kan oppdages ved å studere bruken av Internett. Forskere håper i fremtiden at disse metodene vil kunne bedre identifisere og bistå risikofylte personer.

The Things of Things (IoT)

Massive trover av helsemessig informasjon blir også samlet og lagret på mobile og hjemme enheter .

Finansielle transaksjoner

Pasientens kredittkorttransaksjoner inngår i de prediktive modellene som brukes av Carolinas HealthCare System for å identifisere pasienter som har høy risiko for å bli tilbakestilt til sykehuset. Den Charlotte-baserte helsepersonell bruker store data for å dele pasienter i ulike grupper, for eksempel basert på sykdom og geografisk plassering.

Etiske og personlige konsekvenser

Det må understrekes at det i enkelte tilfeller kan være viktige etiske og personvernimplikasjoner når man samler og får tilgang til data i helsevesenet. Nye kilder til store data kan forbedre vår forståelse av hva som påvirker individer og befolkningshelse, men ulike risikoer må nøye vurderes og overvåkes. Det har nå også blitt anerkjent at data som tidligere ble ansett anonyme, kan omdefineres. For eksempel har professor Latanya Sweeney fra Harvards Data Privacy Lab gjennomgått 1 120 frivillige som er involvert i Personal Genome Project. Hun og hennes team kunne korrekt navn 42 prosent av deltakerne ut fra informasjonen de delte (postnummer, fødselsdato, kjønn). Denne kunnskapen kan øke bevisstheten om potensielle farer og hjelpe oss med å bedre beslutninger om deling av data.

> Kilder:

> Conway M, O'Connor D. Sosiale medier, store data og mental helse: nåværende fremskritt og etiske implikasjoner. Nåværende mening i psykologi 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Store data, større resultater. Journal of The American Health Information Management Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Påvisning av depresjon og psykisk sykdom på sosiale medier: en integrert gjennomgang . Nåværende mening i Behavioral Sciences 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Lignelsen om Google-influensa: Feller i stor dataanalyse . Vitenskap 2014; 343 (6176): 1,203 til 1,205.

> Raghupathi W, Raghupathi V. Stor dataanalyse i helsetjenester: løfte og potensi al. Helseinformasjonsvitenskap og -systemer 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifisere deltakere i Personlig Genom Prosjekt etter navn . Harvard University. Data Privacy Lab. Hvitbok 1021-1. 24. april 2013.