https://data.archives-ouvertes.fr/document/hal-02307577v1

https://data.archives-ouvertes.fr/document/hal-02307577v1

http://purl.org/dc/elements/1.1/subject Données ouvertes liées
http://purl.org/dc/terms/created 2019-10-07T16:51:09
http://purl.org/dc/terms/references https://hal.archives-ouvertes.fr/hal-01094358
http://purl.org/dc/terms/creator _:vb63115581
http://purl.org/dc/elements/1.1/subject Web de données
http://purl.org/dc/terms/creator _:vb63115582
http://purl.org/dc/terms/creator _:vb63115583
http://purl.org/dc/terms/isPartOf https://hal.science
http://purl.org/dc/terms/abstract In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.
http://purl.org/dc/terms/identifier hal-02307577
http://purl.org/dc/terms/creator _:vb12230108
http://purl.org/dc/terms/creator _:vb12230109
http://purl.org/dc/terms/type https://data.archives-ouvertes.fr/doctype/ConferencePaper
http://purl.org/dc/terms/creator _:vb12230110
http://purl.org/dc/elements/1.1/language fr
http://purl.org/dc/terms/rights http://creativecommons.org/licenses/by/
http://purl.org/dc/terms/creator _:vb12230107
http://purl.org/dc/terms/creator _:vb63115584
http://purl.org/dc/elements/1.1/subject Désambiguïsation
http://purl.org/dc/terms/contributor https://data.archives-ouvertes.fr/author/hans-dillaerts
http://purl.org/dc/elements/1.1/subject Linked Open Data
http://purl.org/dc/elements/1.1/subject Web of Data
http://purl.org/dc/terms/isPartOf https://hal.science/CNRS
http://purl.org/dc/terms/title Des bases de données massives au Web de données : désambiguïsation et alignement d'entités géographiques dans les textes scientifiques
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://purl.org/spar/fabio/ConferencePaper
http://purl.org/dc/terms/issued 2019-10-09
http://purl.org/dc/terms/modified 2023-03-24T14:53:12
http://purl.org/dc/terms/isPartOf https://hal.science/ISKOFRANCE2019
http://www.openarchives.org/ore/terms/aggregates https://hal.science/hal-02307577/file/Cuxac_Collignon_Gregorio_Parmentier_isko2019.pdf
http://data.archives-ouvertes.fr/schema/topic https://data.archives-ouvertes.fr/subject/shs.info
http://purl.org/dc/terms/bibliographicCitation Pascal Cuxac, Alain Collignon, Stéphanie Gregorio, François Parmentier. Des bases de données massives au Web de données : désambiguïsation et alignement d'entités géographiques dans les textes scientifiques. 12ème Colloque international d’ISKO-France : Données et mégadonnées ouvertes en SHS : de nouveaux enjeux pour l’état et l’organisation des connaissances ?, Oct 2019, Montpellier, France. ⟨hal-02307577⟩
http://purl.org/dc/elements/1.1/subject Automatic alignment
http://purl.org/dc/terms/identifier https://hal.science/hal-02307577
http://purl.org/dc/terms/isPartOf https://hal.science/SHS
http://purl.org/dc/terms/references https://hal.archives-ouvertes.fr/hal-01404056
http://purl.org/dc/terms/title From massive databases to Web of data: disambiguation and alignment of geographical entities in scientific texts
http://purl.org/dc/elements/1.1/subject Geographic entities
http://purl.org/dc/terms/language http://lexvo.org/id/iso639-1/fr
http://purl.org/dc/terms/source 12ème Colloque international d’ISKO-France : Données et mégadonnées ouvertes en SHS : de nouveaux enjeux pour l’état et l’organisation des connaissances ?
http://purl.org/dc/terms/coverage Montpellier, France
http://purl.org/dc/terms/creator _:vb37647884
http://purl.org/dc/terms/isVersionOf https://data.archives-ouvertes.fr/document/hal-02307577
http://purl.org/dc/terms/creator _:vb37647885
http://purl.org/dc/terms/creator _:vb37647882
http://purl.org/dc/terms/creator _:vb37647883
http://purl.org/dc/terms/abstract Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.
http://purl.org/dc/elements/1.1/subject Alignement automatique
http://purl.org/dc/terms/isPartOf https://hal.science/INIST
http://purl.org/dc/terms/isPartOf https://hal.science/INTERNE-HALCNRS
http://purl.org/dc/elements/1.1/subject Entités géographiques
http://purl.org/dc/terms/available 2019-10-07
http://purl.org/dc/elements/1.1/subject Disambiguation

_:vb63115583

http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/179380

_:vb63115582

http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/21063
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814

_:vb63115584

http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/11817

https://data.archives-ouvertes.fr/document/hal-02307577

http://purl.org/dc/terms/hasVersion https://data.archives-ouvertes.fr/document/hal-02307577v1

_:vb37647883

http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/21063
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814

_:vb37647885

http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/11817
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author

_:vb37647882

http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/179348
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814

_:vb12230107

http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/179348
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author

_:vb37647884

http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/179380
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author

_:vb12230108

http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/21063

_:vb12230109

http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/179380

_:vb63115581

http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/179348
http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author

_:vb12230110

http://data.archives-ouvertes.fr/schema/structure https://data.archives-ouvertes.fr/structure/1814
http://data.archives-ouvertes.fr/schema/person https://data.archives-ouvertes.fr/author/11817
http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://data.archives-ouvertes.fr/schema/Author

Télécharger au format