Giagnolini, Lucia ; Bonora, Paolo ; Tomasi, Francesca
(2024)
Affinare il contesto: estrazione di informazioni strutturate per l’arricchimento dei contesti archivistici.
[Preprint]
Full text available as:
Abstract
Gli strumenti di corredo archivistici in LOD sono spesso solo parzialmente capaci di esprimere il vero potenziale informativo dei dati, a causa della molteplicità di campi non strutturati presenti nelle descrizioni dei complessi documentari. La presenza di numerose sezioni literal, ovvero a testo pieno, limita da un lato la possibilità di interrogazioni a base semantica e dall’altro non consente l’apertura ai numerosi contesti latenti che tali porzioni di testo non strutturato veicolano. Si intende allora qui presentare una metodologia per acquisire nuova conoscenza dai dati, aprendoli al dialogo con nuovi contesti impliciti. A questo scopo, si è valutato quanto possano essere utili alcuni tool ad oggi disponibili per acquisire e restituire informazione strutturata rispetto alle descrizioni archivistiche. Attraverso un caso di studio del Sistema Archivistico Nazionale in LOD si sono analizzate le potenzialità di TINT, FRED e di ChatGPT nell'estrarre informazione morfosintattica, lessicale o semantica dai dati archivistici, riflettendo al contempo sulla possibilità di far dialogare il grafo di conoscenza nativo e il grafo risultante dall’analisi, e documentando gli atti interpretativi emersi.
Abstract
Gli strumenti di corredo archivistici in LOD sono spesso solo parzialmente capaci di esprimere il vero potenziale informativo dei dati, a causa della molteplicità di campi non strutturati presenti nelle descrizioni dei complessi documentari. La presenza di numerose sezioni literal, ovvero a testo pieno, limita da un lato la possibilità di interrogazioni a base semantica e dall’altro non consente l’apertura ai numerosi contesti latenti che tali porzioni di testo non strutturato veicolano. Si intende allora qui presentare una metodologia per acquisire nuova conoscenza dai dati, aprendoli al dialogo con nuovi contesti impliciti. A questo scopo, si è valutato quanto possano essere utili alcuni tool ad oggi disponibili per acquisire e restituire informazione strutturata rispetto alle descrizioni archivistiche. Attraverso un caso di studio del Sistema Archivistico Nazionale in LOD si sono analizzate le potenzialità di TINT, FRED e di ChatGPT nell'estrarre informazione morfosintattica, lessicale o semantica dai dati archivistici, riflettendo al contempo sulla possibilità di far dialogare il grafo di conoscenza nativo e il grafo risultante dall’analisi, e documentando gli atti interpretativi emersi.
Document type
Preprint
Creators
Keywords
Linked Open Data; archivi; information retrieval; supervised annotation; contesti
Subjects
DOI
Deposit date
09 Aug 2024 10:10
Last modified
09 Aug 2024 10:11
URI
Other metadata
Document type
Preprint
Creators
Keywords
Linked Open Data; archivi; information retrieval; supervised annotation; contesti
Subjects
DOI
Deposit date
09 Aug 2024 10:10
Last modified
09 Aug 2024 10:11
URI
Downloads
Downloads
Staff only: