Un nuovo algoritmo automatico per la ricerca e la codifica topografica e morfologica del testo dei referti anatomopatologici

Titolo completo: 
Un nuovo algoritmo automatico per la ricerca e la codifica topografica e morfologica del testo dei referti anatomopatolo
E-mail (autore per corrispondenza): 
rashid.ivan@alice.it
Autore/i: 
Ivan Rashid(1), Ida Galise(1), Danila Bruno(1) Grazia A. Cannone(2), Rosanna Cusimano(3), Rocco Galasso(4), Maria Michiara(5), Fabio Pannozzo(6), Lucia Bisceglia(1)
Istituto/i: 
(1) Registro Tumori Puglia, UO Statistica ed Epidemiologia, IRCCS Oncologico Bari, (2) Registro Tumori Puglia, sezione ASL Barletta-Andria-Trani, (3) Registro Tumori di Palermo e Provincia UOC Sanità Pubblica, Epidemiologia e Medicina Preventiva ASP Palermo, (4) Registro Tumori Basilicata, IRCCS Rionero in Vulture (PZ), (5) Registro Tumori della provincia di Parma, UO Oncologia Medica, AOU Parma, (6) Registro Tumori della provincia di Latina, ASL Latina
Obiettivi: 
La gestione automatizzata dei referti di anatomia patologica e, in particolare, la possibilità di associare a essi un’opportuna codifica tumorale laddove questa fosse imprecisa o mancante, è un aspetto sempre più rilevante nel mondo dei registri tumori (RT). L’obiettivo di questo studio è sperimentare l’utilizzabilità di un nuovo algoritmo automatizzato di codifica dei testi di referti anche attraverso un confronto con la codifica manuale e altre modalità di codifica automatica.
Materiali e metodi: 
L’algoritmo proposto si basa su ricerca di occorrenze nel testo del referto in rapporto con i termini propri del nomenclatore ICD-O-3 e nella loro catalogazione in macro-gruppi, gruppi e singole codifiche topografiche e morfologiche ICD-O-3. L’algoritmo dispone di un sistema di scelta che determina parametricamente la codifica più appropriata al livello di sensibilità desiderato. Sono state effettuate due analisi comparative: la prima, con oggetto la velocità di completamento della codifica, ha interessato fino a 100.000 referti anonimi casuali e fino a dieci possibili scenari. La seconda, che ha valutato la correttezza delle codifiche, è stata condotta tramite un campionamento casuale di circa 2.000 referti dagli archivi di cinque RT. I referti sono stati avviati indipendentemente alla codifica manuale e alla codifica automatica secondo ALADAR.HR (quattro scenari considerati) e secondo l’algoritmo proposto (due scenari). I referti e i codici sono quindi stati rivalutati da un codificatore esperto (DB) allo scopo di definire un’ulteriore codifica da considerarsi come riferimento.
Risultati: 
L’analisi comparativa ha mostrato sensibili differenze in termini di tempo di elaborazione a favore dell’algoritmo da noi proposto. Sui referti tumorali, l’accuratezza della codifica topografica è risultata essere pari all’89% nella codifica manuale, all’87% nell’algoritmo da noi proposto e tra il 41% e il 77% nei differenti scenari di utilizzo di ALADAR.HR. L’accuratezza morfologica è risultata pari al 92% nella codifica manuale, 89% nell’algoritmo da noi proposto e tra il 55% e il 77% in ALADAR.HR. Sulla totalità dei referti la sensibilità / specificità è stata valutata al 94% / 99% per la codifica manuale, 94% / 98% per l’algoritmo da noi proposto e 64-88% / 98% per ALADAR.HR.
Discussione: 
Si conferma l’efficacia sia della codifica manuale sia della codifica automatica tramite il software ALADAR.HR. L’algoritmo da noi proposto potrebbe essere tuttavia considerato una valida alternativa ai precedenti nella codifica topografica e morfologica dei referti ad uso dei RT, sia perché più preciso della codifica effettuata tramite il software ALADAR.HR e sostanzialmente paragonabile alla codifica manuale sia perché, nell’implementazione da noi adottata, ha mostrato indubbie doti di semplicità, configurabilità oltre ad un consistente vantaggio in termini di tempi di elaborazione rispetto alle soluzioni di confronto.