Torsten Hiltmann et al.: NER, aber prompto!

Sdílet
Vložit
  • čas přidán 27. 06. 2024
  • Named Entity Recognition mit Large Language Models für historische Texte.
    Der Vortrag wurde im Rahmen des offenen Forschungskolloquiums "Digital History" an der Humboldt-Universität zu Berlin am 26. Juni 2024 gehalten. Unter dem Titel „NER, aber prompto! Named Entity Recognition mit Large Language Models für historische Texte“ stellt unser Projektteam - bestehend aus Torsten Hiltmann, Martin Dröge, Nicole Dresselhaus, Sophie Eckenstaler, Till Grallert, Jascha Schmitz, Philipp Schneider, Melanie Althage (Humboldt-Universität zu Berlin, NFDI4Memory) - am Beispiel des Baedeker-Reiseführers für Berlin von 1921 vor, wie LLM zur Identifikation und Auszeichnung von Entitäten wie Personen, Orten oder Institutionen verwendet werden können. Die hierfür entwickelte prompt-basierte Methode wurde mit den etablierten Machine-Learning-Ansätzen von spaCy und flair verglichen und zeigte, dass LLM potenziell bessere Ergebnisse erzielen können, ohne dabei ein spezifisch trainiertes Modell oder umfangreich annotierte Trainingsdaten zu bedürfen. Entscheidend ist dafür eine kritische Auseinandersetzung mit den methodologischen Grundlagen sowie eine sorgfältige Evaluation der Resultate, um die Verlässlichkeit und Angemessenheit der LLMs in den Geschichtswissenschaften sicherzustellen.
    Der Abstract zum Vortrag: dhistory.hypotheses.org/7870
    Das Programm des Forschungskolloquiums "Digital History" im Sommersemester 2024: dhistory.hypotheses.org/digit...
    Möchten Sie live bei den Vorträgen dabei sein und mit den Referent*innen diskutieren? Dann tragen Sie sich gerne in unsere Mailingliste ein, um alle relevanten Informationen immer rechtzeitig ins E-Mail-Postfach geliefert zu bekommen: sympa.cms.hu-berlin.de/sympa/...
    #digitalhistory #geschichtswissenschaft #forschungskolloquium #geschichtsforschung #historischeforschung #namedentityrecognition #digitalegeisteswissenschaften #machinelearning

Komentáře •