Removing spam from web corpora through supervised learning using FastText

Standort
Deutsche Nationalbibliothek Frankfurt am Main
Umfang
Online-Ressource
Sprache
Englisch
Anmerkungen
In: Proceedings of the Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. Birmingham, 24 July 2017. - Mannheim : Institut für Deutsche Sprache, 2017., S. 56-60

Klassifikation
Informatik
Schlagwort
Korpus
Internet
Texttechnologie
Datenmanagement

Ereignis
Veröffentlichung
(wo)
Mannheim
(wer)
Institut für Deutsche Sprache, Bibliothek
(wann)
2017
Urheber
Suchomel, Vít
Beteiligte Personen und Organisationen
Bański, Piotr
Kupietz, Marc
Lüngen, Harald
Rayson, Paul
Biber, Hanno
Breiteneder, Evelyn
Clematide, Simon
Mariani, John
Stevenson, Mark
Sick, Theresa

URN
urn:nbn:de:bsz:mh39-62674
Rechteinformation
Der Zugriff auf das Objekt ist unbeschränkt möglich.
Letzte Aktualisierung
14.08.2025, 10:44 MESZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Deutsche Nationalbibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Beteiligte

Entstanden

  • 2017

Ähnliche Objekte (12)