http://purl.org/dc/elements/1.1/subject
|
Données ouvertes liées
|
http://purl.org/dc/terms/created
|
2019-10-07T16:51:09
|
http://purl.org/dc/terms/references
|
https://hal.archives-ouvertes.fr/hal-01094358
|
http://purl.org/dc/terms/creator
|
_:vb63115581
|
http://purl.org/dc/elements/1.1/subject
|
Web de données
|
http://purl.org/dc/terms/creator
|
_:vb63115582
|
http://purl.org/dc/terms/creator
|
_:vb63115583
|
http://purl.org/dc/terms/isPartOf
|
https://hal.science
|
http://purl.org/dc/terms/abstract
|
In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.
|
http://purl.org/dc/terms/identifier
|
hal-02307577
|
http://purl.org/dc/terms/creator
|
_:vb12230108
|
http://purl.org/dc/terms/creator
|
_:vb12230109
|
http://purl.org/dc/terms/type
|
https://data.archives-ouvertes.fr/doctype/ConferencePaper
|
http://purl.org/dc/terms/creator
|
_:vb12230110
|
http://purl.org/dc/elements/1.1/language
|
fr
|
http://purl.org/dc/terms/rights
|
http://creativecommons.org/licenses/by/
|
http://purl.org/dc/terms/creator
|
_:vb12230107
|
http://purl.org/dc/terms/creator
|
_:vb63115584
|
http://purl.org/dc/elements/1.1/subject
|
Désambiguïsation
|
http://purl.org/dc/terms/contributor
|
https://data.archives-ouvertes.fr/author/hans-dillaerts
|
http://purl.org/dc/elements/1.1/subject
|
Linked Open Data
|
http://purl.org/dc/elements/1.1/subject
|
Web of Data
|
http://purl.org/dc/terms/isPartOf
|
https://hal.science/CNRS
|
http://purl.org/dc/terms/title
|
Des bases de données massives au Web de données : désambiguïsation et alignement d'entités géographiques dans les textes scientifiques
|
http://www.w3.org/1999/02/22-rdf-syntax-ns#type
|
http://purl.org/spar/fabio/ConferencePaper
|
http://purl.org/dc/terms/issued
|
2019-10-09
|
http://purl.org/dc/terms/modified
|
2023-03-24T14:53:12
|
http://purl.org/dc/terms/isPartOf
|
https://hal.science/ISKOFRANCE2019
|
http://www.openarchives.org/ore/terms/aggregates
|
https://hal.science/hal-02307577/file/Cuxac_Collignon_Gregorio_Parmentier_isko2019.pdf
|
http://data.archives-ouvertes.fr/schema/topic
|
https://data.archives-ouvertes.fr/subject/shs.info
|
http://purl.org/dc/terms/bibliographicCitation
|
Pascal Cuxac, Alain Collignon, Stéphanie Gregorio, François Parmentier. Des bases de données massives au Web de données : désambiguïsation et alignement d'entités géographiques dans les textes scientifiques. 12ème Colloque international d’ISKO-France : Données et mégadonnées ouvertes en SHS : de nouveaux enjeux pour l’état et l’organisation des connaissances ?, Oct 2019, Montpellier, France. ⟨hal-02307577⟩
|
http://purl.org/dc/elements/1.1/subject
|
Automatic alignment
|
http://purl.org/dc/terms/identifier
|
https://hal.science/hal-02307577
|
http://purl.org/dc/terms/isPartOf
|
https://hal.science/SHS
|
http://purl.org/dc/terms/references
|
https://hal.archives-ouvertes.fr/hal-01404056
|
http://purl.org/dc/terms/title
|
From massive databases to Web of data: disambiguation and alignment of geographical entities in scientific texts
|
http://purl.org/dc/elements/1.1/subject
|
Geographic entities
|
http://purl.org/dc/terms/language
|
http://lexvo.org/id/iso639-1/fr
|
http://purl.org/dc/terms/source
|
12ème Colloque international d’ISKO-France : Données et mégadonnées ouvertes en SHS : de nouveaux enjeux pour l’état et l’organisation des connaissances ?
|
http://purl.org/dc/terms/coverage
|
Montpellier, France
|
http://purl.org/dc/terms/creator
|
_:vb37647884
|
http://purl.org/dc/terms/isVersionOf
|
https://data.archives-ouvertes.fr/document/hal-02307577
|
http://purl.org/dc/terms/creator
|
_:vb37647885
|
http://purl.org/dc/terms/creator
|
_:vb37647882
|
http://purl.org/dc/terms/creator
|
_:vb37647883
|
http://purl.org/dc/terms/abstract
|
Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.
|
http://purl.org/dc/elements/1.1/subject
|
Alignement automatique
|
http://purl.org/dc/terms/isPartOf
|
https://hal.science/INIST
|
http://purl.org/dc/terms/isPartOf
|
https://hal.science/INTERNE-HALCNRS
|
http://purl.org/dc/elements/1.1/subject
|
Entités géographiques
|
http://purl.org/dc/terms/available
|
2019-10-07
|
http://purl.org/dc/elements/1.1/subject
|
Disambiguation
|