Routine Outcome Measurement in de dagelijkse praktijk
Paul van der Vlist 12 januari 2011 samenvatting
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
ROM in de dagelijkse praktijk De instellingen binnen de geestelijke gezondheidszorg, verslavingszorg en forensische psychiatrie – in dit document gemakshalve gezamenlijk als ggz aangeduid - hebben in 2010 belangrijke stappen gezet in de ontwikkeling en invoering van Routine Outcome Measurement (ROM). ROM beoogt het inzichtelijk krijgen van het effect van de geleverde zorg. Als primaire doelstelling is vastgesteld dat ROM de dagelijkse praktijk van behandelen en begeleiden moet ondersteunen. Naast deze belangrijkste kernfunctie zijn de overige kernfuncties van ROM gericht op leren, verantwoorden en onderzoeken. Het meest eenvoudig is dat voor het richten, inrichten en omvormen van de ggz inzake ROM het realiseren van deze primaire doelstelling als vertrekpunt wordt genomen. Dit is goed mogelijk met behoud van voldoende ruimte en flexibiliteit om de overige doelstellingen eveneens adequaat te bewerkstelligen. Project en keuzes De koepelorganisatie GGZ Nederland is in 2009 het project ROMggz gestart. De besluitvorming hiertoe werd gestimuleerd door druk vanuit de zorgverzekeraars om het effect van de geleverde zorg inzichtelijk te maken. Alhoewel hiermee het accent op “verantwoorden” werd gelegd, hebben partijen - instellingen en zorgverzekeraars – gezamenlijk vastgesteld dat “behandelen/begeleiden” de primaire kernfunctie van ROM is. De ervaren druk heeft er wel toe geleid dat de kernfunctie “verantwoorden” een redelijk dominante positie heeft ingenomen en wellicht nog steeds inneemt. De paradox is dat zonder deze druk de ontwikkeling minder voortvarend zou zijn verlopen. De consequentie van (het ondersteunen van) de kernfunctie “behandelen/begeleiden” als primaire doelstelling van ROM, is dat het richtinggevend is voor een aantal belangrijke beslissingen. Dit betreft onder meer de indeling van doelgroepen, de keuze van meetinstrumenten, meetmomenten en –frequentie, hoe en door wie de metingen worden afgenomen en de wijze van terugkoppeling van uitkomstgegevens. Als we bijvoorbeeld kijken naar de selectiecriteria voor meetinstrumenten dan zijn naast psychometrische eigenschappen als betrouwbaarheid, validiteit en sensitiviteit voor verandering ook belangrijk kenmerken de gebruiksvriendelijkheid, een beperkte afnameduur en overzichtelijke presentatie van uitkomsten ten behoeve van zorgverlener en cliënt.
ROM in de dagelijkse praktijk – samenvatting - II -
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
De aangegeven prioriteit, ROM primair voor behandelen/begeleiden, betekent ook dat het realiseren van de overige kernfuncties in de uitwerking afgeleid zijn of worden. Als we bijvoorbeeld kijken naar meetmomenten dan lijkt het logisch om metingen uit te voeren op die tijdstippen waarop het voor het behandelen/begeleiden het meest relevant is. Dit kan strijdig zijn met de ‘belangen’ voor “verantwoorden”, waar koppeling met het DBC-registratieproces gewenst is, en “onderzoeken”, waar vaste momenten en frequenties voor goede vergelijkbaarheid van uitkomsten noodzakelijk is. Instellingen maken gebruik van verschillende meetinstrumenten binnen diverse organisatorische inrichtingen. Om nu al allerlei regels op te leggen, voor zover dat ooit al moet, is er nog onvoldoende onderbouwing en argumentatie. Deze keuze om nog niet te kiezen heeft echter ook consequenties. Het is denkbaar dat bestuurders wel vergaande keuzes maken, bijvoorbeeld door een zeer gelimiteerde set aan toegestane meetinstrumenten en vaste meetmomenten en –frequentie vast te stellen, alsook door voor alle doelgroepen een zelfde werkwijze voor te schrijven. Vraagstelling is echter wat de toegevoegde waarde van een dusdanig stoere en geforceerde besluitvorming is. Het is helemaal niet zeker dat ROM daardoor beter en eenvoudiger wordt. Indicatoren en kernfuncties De druk van de zorgverzekeraars en daarmee het accent op “verantwoorden” heeft ertoe geleid dat veel aandacht besteed is en wordt aan het inzichtelijk krijgen van het effect van de geleverde zorg. In de Kernset Prestatie-indicatoren 2011 (Stuurgroep Zichtbare Zorg GGZ, 2010) zijn als de daartoe van belang zijnde indicatoren aangegeven de verandering in de ernst van de problematiek, de verandering in het dagelijks functioneren van cliënten, en de verandering in de ervaren kwaliteit van leven van de cliënt. Alhoewel verschillende belanghebbenden ook verschillend oordelen over de waarde, onder meer omtrent de mate van objectiviteit, zijn genoemde indicatoren als uitgangspunt voor het project ROMggz genomen en door de zorgverzekeraars geaccepteerd. Cliëntgerichtheid, ofwel de indicator “informed consent” is verplicht voor kortdurende ambulante behandeling (< 2 jaar), maar wordt (nog) door een onafhankelijke partij gemeten. Dit heeft consequenties voor de implementatie van ROM. Onderkend wordt dat het welslagen van de implementatie en het gebruik van ROM sterk bepaald wordt door goede betrokkenheid en verplichting van behandelaar en cliënt. En dus vraagt de inrichting van de kernfunctie “behandelen/begeleiden” veel aandacht. Dit kan echter niet zonder op betekenisvolle wijze te kunnen vergelijken, ten behoeve van het “leren”, “verantwoorden” en “onderzoeken”. De behandelaar voelt zich gesterkt als gebruik gemaakt wordt van wetenschappelijk bewezen meetinstrumenten. Onderzoek heeft dus invloed op de waardering van het behandelen/begeleiden. De vier kernfuncties moeten daarom steeds in hun gezamenlijkheid beschouwd worden.
ROM in de dagelijkse praktijk – samenvatting - III -
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
Doelgroepen en casemix Er is geen consensus over de indeling in groepen. Officiële instanties binnen de ggz, zoals GGZ Nederland en Zichtbare Zorg GGZ, hanteren verschillende indelingen. De organisatorische inrichting van instellingen verschilt en is derhalve niet zonder meer richtinggevend voor een groepsindeling. Er zit zelfs enig toeval in welke groep een cliënt terecht komt vanwege de organisatorische inrichting van de instelling waar cliënt zich aanmeldt. Veelal zijn instellingen naar doelgroep georganiseerd. Meetinstrumenten voor ROM zijn gekoppeld aan de behandeldoelstellingen die bij een bepaalde doelgroep behoren. Reden waarom in het project ROMggz gekozen is voor een indeling in doelgroepen. Boeiend vraagstuk is vervolgens hoe betekenisvol te vergelijken. Kijkend naar instellingen en zelfs binnen instellingen zijn grote verschillen in cliëntenpopulaties waar te nemen. Op basis van demografische gegevens en klinische problematiek moet de casemix bepaald worden. Betekenisvol vergelijken kan eigenlijk alleen met vergelijkbare referentiegroepen. Kijkend naar de casemix zullen ook nog correcties nodig blijken. De factoren die hiertoe van belang zijn, zijn veelal nog niet vastgesteld. Casemixcorrectie zal derhalve voorlopig nog maar zeer beperkt mogelijk zijn. Meetinstrumenten en keuzecriteria Het project ROMggz richt zich op c.q. beperkt zich tot generieke meetinstrumenten. Er wordt dus niet gekeken naar stoornisspecifieke meetinstrumenten, terwijl voor het ondersteunen van behandelen/begeleiden deze instrumenten onontbeerlijk zijn. De reden hiervoor is dat naarmate de stoornis specifieker is, de betreffende cliëntenpopulatie kleiner is. Een stoornisspecifiek instrument geeft wel een meer specifiek inzicht, hetgeen voor het behandelen/begeleiden op betreffend moment erg nuttig is. Maar het is zeer de vraag of betreffende instrumenten voldoende sensitief zijn voor verandering. Voor vergelijkbaarheid, dus voor “leren”, “verantwoorden” en “onderzoeken”, zijn mogelijk de aantallen van vergelijkbare metingen beperkt. Het begrip “generiek” is betrekkelijk. Kijkend naar de verschillende doelgroepen blijken voor de betreffende indicatoren verschillende instrumenten geselecteerd. Daarnaast zijn er slechts een beperkt aantal instrumenten die meer dan één indicator bedienen. Meetinstrumenten moeten klinisch relevant, valide, betrouwbaar en gevoelig voor verandering zijn, tevens het cliëntperspectief meten en hun kwaliteiten bewezen hebben in nationaal en/of internationaal onderzoek. Voorts is er behoefte om criteria als gebruiksvriendelijkheid, beperkte afnameduur en dergelijke mede in ogenschouw te nemen. Tot heden richt onderzoek zich vooral op de psychometrische
ROM in de dagelijkse praktijk – samenvatting - IV -
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
kenmerken. Er is nog geen onafhankelijke toetsingsbureau die een keurmerk toekent aan een meetinstrument. Kijkend naar de verschillende belangen van direct berokkenen is goede weging niet eenvoudig. Per doelgroep is er nu wel een overzicht van een beperkt aantal aanbevolen meetinstrumenten. Duidelijk is al wel dat met behulp van deze aanbevolen instrumenten het onmogelijk is voor de drie indicatoren c.q. meetdomeinen alle cliënten van een instelling te monitoren. Dit alleen al door de beperkingen van de meetinstrumenten zelf. Apart vraagstuk betreft nog de keuze van het type meetinstrument: een beoordelingslijst, een interviewlijst of een zelfrapportagelijst. Het meest complete beeld wordt verkregen in een combinatie van beoordelings- of interviewlijst (zorgverlener) met een zelfrapportagelijst (cliënt). De meningen zijn nog wel verdeeld over de waardering voor het ene of het andere type meetinstrument. Bij een aantal doelgroepen zijn er ook nog verschillende informanten, waaronder bij Kinderen & Jeugd (jongere, ouder, verzorger en/of leerkracht) en Ouderen (cliënt of mantelzorger). Tot slot moet aandacht geschonken worden aan verschillende versies en daarbinnen soms nog verschillende variaties van hetzelfde meetinstrument. In de praktische toepassing hebben gebruikers voor het gemak bepaalde, voor hen niet zo van belang lijkende vragen uit een vragenlijst verwijderd. Vaak is dit niet vastgelegd en zijn er derhalve meerdere variaties op een ogenschijnlijk zelfde instrument ontstaan. In termen van vergelijkbaarheid kan dit vreemd uitpakken. Meetmomenten en -frequentie Grofweg zijn er drie mogelijkheden voor een keuze voor meetmomenten: (1) metingen koppelen aan het openen en sluiten van de (vervolg-)DBC, (2) metingen koppelen aan logische momenten in het behandel/evaluatieproces, en (3) metingen koppelen aan vaste momenten en in vaste frequentie. De keuze wordt (mede) bepaald door waar je het accent legt inzake de doelstelling(en) van ROM. Door alle partijen, ook de zorgverzekeraars, is het ondersteunen van het "behandelen/begeleiden" als primaire kernfunctie benoemd. Dit is gericht op het individuele niveau van de cliënt en de behandelaar(s) en is primair een aangelegenheid van de instellingen. De overige drie kernfuncties hebben met vergelijken en vergelijkbaarheid te maken. De meest belangrijke functie van deze drie is het "leren" ofwel de spiegelinformatie (team, afdeling, instelling). Onontkoombaar is het "verantwoorden", ofwel de benchmarking. Ten aanzien van het "onderzoeken" weten we dat we erg veel data verzameld moeten hebben, wil ROM hiervoor betekenis hebben.
ROM in de dagelijkse praktijk – samenvatting -V-
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
Bij keuze voor het koppelen aan het DBC-registratieproces (1) is het denkbaar dat de tijdstippen van openen en sluiten van de DBC niet aansluiten op logische momenten in het behandel/evaluatieproces. De DBC-registratie heeft als weeffout dat bedoelde tijdstippen niet hard gekoppeld zijn aan logische momenten in het behandel/evaluatieproces. Instellingen zullen dat niet allemaal op een eenduidige manier ingericht hebben (bijvoorbeeld allemaal het openen van de DBC twee weken voor de intake). In termen van vergelijkbaarheid, waaronder ook benchmarking, heb je dan eigenlijk al een probleem. We weten echter niet of dit een groot probleem is, zelfs als er grote verschillen tussen instellingen zitten inzake bedoelde tijdstippen. Geleidelijk aan, op basis van steeds meer data, zal dit geanalyseerd kunnen en gaan worden. Bij de keuzes met betrekking tot logische of vaste momenten (2 en 3) is het nog steeds noodzakelijk om te besluiten wanneer metingen plaats moeten vinden (bijvoorbeeld beginmeting bij aanmelding, intake of begin behandeling). De keuze voor logische momenten (2) lijkt het meest aan te sluiten op de primaire kernfunctie van behandelen/begeleiden. Maar gegeven de verschillen in inrichting tussen instellingen, doet dit gevoelsmatig ook het meest geweld aan vergelijkbaarheid. Maar ook hier weten we niet hoe groot het probleem is. De keuze voor vaste momenten en met een vaste frequentie (3) lijkt het meest aan te sluiten op de eisen voor vergelijkbaarheid. Ook moet dit met enige voorzichtigheid gesteld worden, want er zijn nog steeds veel variaties denkbaar. Het meest 'hard' is een definitie zoals: voor iedere cliënt binnen iedere instelling beginmeting bij intake en iedere 6 maanden een vervolgmeting (dat op enig moment ook een eindmeting kan blijken te zijn). Behandeldoelen en -uitkomsten Het doel van behandeling is grofweg onder te verdelen in cure - herstel of verbetering – en care – stabilisatie of voorkomen van verdere verslechtering. Algemeen kan gesteld worden dat kortdurende behandeling zich richt op herstel of verbetering, en dat bij langdurende behandeling het doel van behandeling ook ‘slechts’ stabilisatie of voorkomen van verdere verslechtering kan zijn. Het effect van zorg zal met het oog op het behandeldoel ‘gewaardeerd’ moeten worden. Kijkend naar de indicatoren die in het bijzonder van belang zijn voor de resultaten van zorg, kort gezegd “ernst problematiek”, “dagelijks functioneren” en “kwaliteit van leven”, kan de situatie zich voordoen dat de ernst van de problematiek gelijk blijft of zelfs verslechterd maar in het dagelijks functioneren en/of de kwaliteit van leven verbetering is opgetreden. Conclusie van cliënt en behandelaar kan zijn dat het (gepercipieerde) effect van zorg als goed gewaardeerd wordt. Rekenkundig kan dit leiden tot een geheel andere waardering. Het is zelfs denkbaar dat genoemde indicatoren alle drie een verslechtering te zien geven, maar dat indicatoren als “vervulde zorgbehoeften” en “tevredenheid met de geleverde zorg” wel verbeteringen te zien geven.
ROM in de dagelijkse praktijk – samenvatting - VI -
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
Er is een tweetal verantwoordingsniveaus waarop duidelijk gemaakt kan worden wat het resultaat is van de zorg die geleverd wordt. Het onderscheid in verantwoordingsniveaus is ook wel aangeduid als ROMan (management) en ROMon (monitoring) (Oudejans, 2009). ROMan is gedefinieerd als het terugkoppelen van uitkomstgegevens achteraf – over groepen cliënten, afdelingen of instellingen – met als doel te leren over zorgprogramma’s en het gericht sturen van de organisatie. ROMon is gedefinieerd als het op vooraf bepaalde momenten in het zorgproces uitkomsten meten met als doel het individuele zorgtraject te volgen en waar nodig bij te stellen. ROMan zal gedurende de eerste periode van gegevensverzameling vooral gericht zijn op het meten en rapporteren van de wijze waarop de zorg wordt verleend (proces). Pas als voldoende data beschikbaar zijn, kan het leren op het niveau van groepen cliënten, van teams, van afdelingen of van instellingen plaatsvinden. ROMon stelt hoge eisen aan de kwaliteit en betrouwbaarheid van de uitkomstgegevens. In het Beslisdocument Vergelijkbaarheid (Tiemens e.a., 2009), opgeleverd in het kader van het project ROMggz, zijn drie manieren beschreven om vergelijkingen te maken tussen meerdere metingen: 1. Verandering: een eenvoudige vergelijking van gestandaardiseerde scores, 2. Statistisch relevante verandering (Reliable Change Index): een vergelijking van scores, rekening houdend met meetfouten, 3. Klinisch relevante verandering (Clinically Significant Change): een vergelijking van genormeerde scores, rekening houdend met de vraag of verandering plaats vindt van een “klinische” score naar een “normale” score. Behandeluitkomsten kunnen gebaseerd zijn op de verandering tussen twee metingen (in beginsel begin- en eindmeting) alsook uitsluitend op de eindmeting (Blanken e.a., 2010). Voorts kan de behandeluitkomst ‘grofmazig’ dan wel ‘fijnmazig’ gerapporteerd worden. Grofmazig kan zijn: hersteld/abstinent of niet, verbeterd of niet, gestabiliseerd of niet. Fijnmazig wordt uitgedrukt in betrouwbare en klinische relevante verandering. Minimale dataset Voor betekenisvol vergelijken is van belang dat een minimale set aan gegevens op eenduidige wijze wordt aangeleverd. Deze minimale dataset omvat onder meer gegevens over de instelling, allerlei achtergrondinformatie betreffende de cliënt en, uiteraard, de uitkomstgegevens van de metingen. In grote lijnen is er overeenstemming over de minimale dataset in het kader van het project ROMggz. Definitieve vaststelling is van belang opdat partijen in het veld – instellingen, applicatieleveranciers, gegevensverwerkers – betreffende informatiesystemen kunnen
ROM in de dagelijkse praktijk – samenvatting - VII -
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
aanpassen. Het verzamelen van betreffende gegevens vereist immers het bijeen brengen van deze gegevens vanuit diverse informatiesystemen (ROM, EPD, zorgregistratie, datawarehouse e.d.). Dit is primair de verantwoordelijkheid van de instellingen. De meeste gegevens worden al structureel geregistreerd ten behoeve van de elektronische dossiers en de DBC-registratie. Ten behoeve van het “verantwoorden” ofwel voor benchmarking zullen gegevens aangeleverd moeten worden aan een stichting waarvan in het bestuur zowel de instellingen, het landelijke platform GGZ (cliënten en hun familie) als de zorgverzekeraars zitting hebben. Uit deze verantwoordingsinformatie zal ook procesinformatie beschikbaar komen, een deel van hetgeen met het “leren” beoogd wordt. Diverse ROM-initiatieven hebben de pretentie en deels al de potentie om de overige kernfuncties te bedienen. De doelstelling en organisatie van deze instanties is verschillend. Niet duidelijk is wat hun rol en positie is binnen de toekomstige ROM-infrastructuur. Belanghebbenden en terugkoppeling Als belanghebbenden zijn te onderscheiden: de cliënt, de behandelaar, de ondersteuner, de direct leidinggevende, de ketenpartner, de onderzoeker, de bestuurder, de overheid, de zorgverzekeraar. De vier kernfuncties van ROM gelegd tegen de belanghebbenden levert het volgende beeld: • behandelen/begeleiden: ondersteunen behandel/evaluatieproces - cliënt, behandelaar • leren: verbeteren zorgverlening - behandelaar, ondersteuner, direct leidinggevende, ketenpartner, bestuurder • verantwoorden: verantwoording resultaten - behandelaar, direct leidinggevende, bestuurder, overheid, zorgverzekeraar • onderzoeken: uitvoeren onderzoeken - behandelaar, onderzoeker, bestuurder Voornoemde laat zien dat veel belanghebbenden belang hebben bij vrijwel alle kernfuncties. Kijkend naar vergelijkbaarheid dan levert ROM de volgende baten: • Het toepassen van ROM levert direct inzicht in de actuele situatie van de cliënt, zowel bij aanvang van de behandeling (vaststellen ernst van de klacht) als op momenten van evaluatie (verandering in meerdere uitkomstdomeinen). Al dan niet bijstelling van de behandeling is meer onderbouwd, mede op basis van landelijke gemiddelden en best practices (spiegelinformatie). • Op basis van de procesgerichte analyses ontstaat inzicht in de meest gebruikte meetinstrumenten, kan mogelijk bepaald worden of meetmomenten meer eenduidig vast te stellen zijn, en ontstaat een beeld omtrent het inzicht dat per uitkomstdomein verkregen (kan) worden.
ROM in de dagelijkse praktijk – samenvatting - VIII -
Routine Outcome Measurement in de dagelijkse praktijk ROM in de dagelijkse praktijk
• • •
• •
De inhoudelijke analyses geven inzicht in het beloop op de diverse uitkomstdomeinen, hetgeen iets zegt over het resultaat van de behandeling of begeleiding en mogelijk de afweging tot al dan niet bijstelling ondersteunt. De inhoudelijke terugkoppeling biedt de mogelijkheid om binnen een behandelteam mogelijk geconstateerde verschillen in behandelresultaten te analyseren en te bediscussiëren. Voorts kan dit ook in regionale of landelijke overleggen aan de orde komen. Het resultaat van de behandeling kan intern verantwoord worden. In eerste instantie kan dit op het niveau van procesvariabelen, in een later stadium kan dit inhoudelijk gestaafd worden. Ten aanzien van laatstgenoemde is een toegevoegde waarde dat de kwaliteit en betrouwbaarheid van gebruikte meetinstrumenten onomstreden en gehanteerde systematiek landelijk vastgesteld is. Naar financiers kan verantwoording afgelegd worden op basis van (inter-) nationaal gevalideerde en genormeerde instrumenten en door de sector breed geaccepteerde en toegepaste systematieken. Voor onderzoekers ontstaat een steeds grotere gegevensbron om zowel op de procesmatige als de inhoudelijke aspecten onderzoek uit te kunnen voeren. Onderzoeksresultaten versterken het praktische gebruik en staven de verantwoording.
ROM in de dagelijkse praktijk – samenvatting - IX -
Routine Outcome Measurement in de dagelijkse praktijk Brondocumenten
Brondocumenten
Blanken, P., Hendriks, V. & Dijkhuizen, L. (2010). Definitie behandel-respons Brijder. Haarlem/Den Haag: Brijder/PBG. Oudejans, S. (2009). Routine outcome monitoring & learning organizations in substance abuse treatment. Academisch proefschrift, UvA. Stuurgroep Zichtbare Zorg GGZ (2010). Kernset Prestatie-indicatoren 2011. Geestelijke gezondheidszorg en verslavingszorg. Den Haag, Zichtbare Zorg GGZ. Tiemens, B., Kamsteeg, F., Schippers, G., e.a. (2009). Beslisdocument Vergelijkbaarheid. Amersfoort: GGZ Nederland.
ROM in de dagelijkse praktijk – samenvatting -1-