Giagnolini, Lucia ; Bonora, Paolo ; Tomasi, Francesca
(2024)
Affinare il contesto: estrazione di informazioni strutturate per l’arricchimento dei contesti archivistici.
[Preprint]
Full text disponibile come:
Abstract
Gli strumenti di corredo archivistici in LOD sono spesso solo parzialmente capaci di esprimere il vero potenziale informativo dei dati, a causa della molteplicità di campi non strutturati presenti nelle descrizioni dei complessi documentari. La presenza di numerose sezioni literal, ovvero a testo pieno, limita da un lato la possibilità di interrogazioni a base semantica e dall’altro non consente l’apertura ai numerosi contesti latenti che tali porzioni di testo non strutturato veicolano. Si intende allora qui presentare una metodologia per acquisire nuova conoscenza dai dati, aprendoli al dialogo con nuovi contesti impliciti. A questo scopo, si è valutato quanto possano essere utili alcuni tool ad oggi disponibili per acquisire e restituire informazione strutturata rispetto alle descrizioni archivistiche. Attraverso un caso di studio del Sistema Archivistico Nazionale in LOD si sono analizzate le potenzialità di TINT, FRED e di ChatGPT nell'estrarre informazione morfosintattica, lessicale o semantica dai dati archivistici, riflettendo al contempo sulla possibilità di far dialogare il grafo di conoscenza nativo e il grafo risultante dall’analisi, e documentando gli atti interpretativi emersi.
Abstract
Gli strumenti di corredo archivistici in LOD sono spesso solo parzialmente capaci di esprimere il vero potenziale informativo dei dati, a causa della molteplicità di campi non strutturati presenti nelle descrizioni dei complessi documentari. La presenza di numerose sezioni literal, ovvero a testo pieno, limita da un lato la possibilità di interrogazioni a base semantica e dall’altro non consente l’apertura ai numerosi contesti latenti che tali porzioni di testo non strutturato veicolano. Si intende allora qui presentare una metodologia per acquisire nuova conoscenza dai dati, aprendoli al dialogo con nuovi contesti impliciti. A questo scopo, si è valutato quanto possano essere utili alcuni tool ad oggi disponibili per acquisire e restituire informazione strutturata rispetto alle descrizioni archivistiche. Attraverso un caso di studio del Sistema Archivistico Nazionale in LOD si sono analizzate le potenzialità di TINT, FRED e di ChatGPT nell'estrarre informazione morfosintattica, lessicale o semantica dai dati archivistici, riflettendo al contempo sulla possibilità di far dialogare il grafo di conoscenza nativo e il grafo risultante dall’analisi, e documentando gli atti interpretativi emersi.
Tipologia del documento
Preprint
Autori
Parole chiave
Linked Open Data; archivi; information retrieval; supervised annotation; contesti
Settori scientifico-disciplinari
DOI
Data di deposito
09 Ago 2024 10:10
Ultima modifica
09 Ago 2024 10:11
URI
Altri metadati
Tipologia del documento
Preprint
Autori
Parole chiave
Linked Open Data; archivi; information retrieval; supervised annotation; contesti
Settori scientifico-disciplinari
DOI
Data di deposito
09 Ago 2024 10:10
Ultima modifica
09 Ago 2024 10:11
URI
Statistica sui download
Statistica sui download
Gestione del documento: