Buchbeitrag

Statistisch basierte Sprachmodelle und maschinelle Übersetzung

Statistische Methoden finden derzeit in der Sprachtechnologie vielfache Verwendung. Ein Grundgedanke dabei ist das Trainieren von Programmen auf große Mengen von Daten. Für das Trainieren von statistischen Sprachmodellen gilt zur Zeit das Motto „Je mehr Daten desto besser“. In unserem System zur maschinellen Übersetzung sehen wir eine fast konstante qualitative Verbesserung (gemessen als BLEU-Score) mit jeder Verdoppelung der monolingualen Trainingsdatenmenge. Selbst bei Mengen von ca. 20 Milliarden Wörtern aus Nachrichtentexten und ca. 200 Milliarden Wörtern aus Webseiten ist kein Abflachen der Lernkurve in Sicht. Dieser Artikel gibt kurze Einführungen in statistische maschinelle Übersetzung, die Evaluation von Übersetzungen mit dem BLEU-Score, und in statistische Sprachmodelle. Wir zeigen, welch starken Einfluß die Größe der Trainingsdaten des Sprachmodells auf die Übersetzungsqualität hat. Danach wird die Speicherung großer Datenmengen, das Trainieren in einer parallelen Architektur und die effiziente Verwendung der bis zu 1 Terabyte großen Modelle in der maschinellen Übersetzung beschrieben.

Language: Deutsch

Subject: Maschinelle Übersetzung
Korpus <Linguistik>
Germanische Sprachen; Deutsch

Event: Geistige Schöpfung

(who): Brants, Thorsten

Event: Veröffentlichung

(who): Berlin [u.a.] : de Gruyter

(when): 2018-09-25

Last update: 06.03.2025, 9:00 AM CET

Data provider

This object is provided by:
Leibniz-Institut für Deutsche Sprache - Bibliothek. If you have any questions about the object, please contact the data provider.

Show original at data provider

Object type

Buchbeitrag

Associated

Brants, Thorsten
Berlin [u.a.] : de Gruyter

Time of origin

2018-09-25

Other Objects (12)

Buchbeitrag

Maschinelle Übersetzung – Gegenwart und Perspektiven

Buchbeitrag

Zur maschinellen Rekonstruktion natürlich-sprachlicher Dialoge

Buchbeitrag

Räumliche Implikationen einer auf Wissen basierten Wirtschaftsentwicklung

Buchbeitrag

Konstruktionsprinzipien für ein Lexikon in der maschinellen Sprachverarbeitung

Buchbeitrag

Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora

Buchbeitrag

Der Aufbau einer maßgeschneiderten XML-basierten Modellierung für ein Wörterbuchnetz

Buchbeitrag

TEI-basierte Modellierung von Retrodigitalisaten (am Beispiel des Trierer Wörterbuchnetzes)

Buchbeitrag

Zur Dokumentation und maschinellen Bearbeitung von Zeitungstexten in der Außenstelle Bonn

Buchbeitrag

Internetbasierte Kommunikation als Textformen-basierte Interaktion: ein neuer Vorschlag zu einem alten Problem

Buchbeitrag

Meta-computerlexikografische Bemerkungen zu Vernetzungen in XML-basierten Onlinewörterbüchern – am Beispiel von "elexiko"

Buchbeitrag

Rechtschreibreform und maschinelle Sprachverarbeitung. Oder: Von der Unwahrscheinlichkeit, in Computern Liebe genossen zu haben

Buchbeitrag

Determinantien und Pronomina unter dem Aspekt einer maschinellen Syntaxanalyse der deutschen Gegenwartssprache : zur syntaktischen Definition von Wortklassen

Buchbeitrag

Maschinelle Übersetzung – Gegenwart und Perspektiven

Buchbeitrag

Zur maschinellen Rekonstruktion natürlich-sprachlicher Dialoge

Buchbeitrag

Räumliche Implikationen einer auf Wissen basierten Wirtschaftsentwicklung

Buchbeitrag

Konstruktionsprinzipien für ein Lexikon in der maschinellen Sprachverarbeitung

Buchbeitrag

Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora

Buchbeitrag

Der Aufbau einer maßgeschneiderten XML-basierten Modellierung für ein Wörterbuchnetz

Buchbeitrag

TEI-basierte Modellierung von Retrodigitalisaten (am Beispiel des Trierer Wörterbuchnetzes)

Buchbeitrag

Zur Dokumentation und maschinellen Bearbeitung von Zeitungstexten in der Außenstelle Bonn

Buchbeitrag

Internetbasierte Kommunikation als Textformen-basierte Interaktion: ein neuer Vorschlag zu einem alten Problem

Buchbeitrag

Meta-computerlexikografische Bemerkungen zu Vernetzungen in XML-basierten Onlinewörterbüchern – am Beispiel von "elexiko"

Buchbeitrag

Rechtschreibreform und maschinelle Sprachverarbeitung. Oder: Von der Unwahrscheinlichkeit, in Computern Liebe genossen zu haben

Buchbeitrag

Determinantien und Pronomina unter dem Aspekt einer maschinellen Syntaxanalyse der deutschen Gegenwartssprache : zur syntaktischen Definition von Wortklassen

Buchbeitrag

Maschinelle Übersetzung – Gegenwart und Perspektiven

Buchbeitrag

Zur maschinellen Rekonstruktion natürlich-sprachlicher Dialoge

Buchbeitrag

Räumliche Implikationen einer auf Wissen basierten Wirtschaftsentwicklung

Buchbeitrag

Konstruktionsprinzipien für ein Lexikon in der maschinellen Sprachverarbeitung

Buchbeitrag

Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora

Buchbeitrag

Der Aufbau einer maßgeschneiderten XML-basierten Modellierung für ein Wörterbuchnetz

Buchbeitrag

TEI-basierte Modellierung von Retrodigitalisaten (am Beispiel des Trierer Wörterbuchnetzes)

Buchbeitrag

Zur Dokumentation und maschinellen Bearbeitung von Zeitungstexten in der Außenstelle Bonn

Buchbeitrag

Internetbasierte Kommunikation als Textformen-basierte Interaktion: ein neuer Vorschlag zu einem alten Problem

Buchbeitrag

Meta-computerlexikografische Bemerkungen zu Vernetzungen in XML-basierten Onlinewörterbüchern – am Beispiel von "elexiko"

Buchbeitrag

Rechtschreibreform und maschinelle Sprachverarbeitung. Oder: Von der Unwahrscheinlichkeit, in Computern Liebe genossen zu haben

Buchbeitrag

Determinantien und Pronomina unter dem Aspekt einer maschinellen Syntaxanalyse der deutschen Gegenwartssprache : zur syntaktischen Definition von Wortklassen

Cultural heritage institutions wishing to register will find more information here.

Fields marked * need to be filled in.

Username*

Please enter your username

Email*

Please enter your email address

Please do not fill this field

First name

Last name

Password*

Please enter your password

Confirm password*

Please enter the same password

I have read the terms of use and the privacy policy for the collection of personal data and accept them. *

This field is required.

I would like to subscribe to the newsletter of the Deutsche Digitale Bibliothek. See newsletter subscription info.

Account created

Your "My DDB" account has been successfully created. Before you can log in to your account, you must click the confirmation link in the message we just sent to the email address you provided.

Statistisch basierte Sprachmodelle und maschinelle Übersetzung

Object Details

Classification and Topics

Contributors, Places and Time

Further information

Data provider

Object type

Associated

Time of origin

Other Objects (12)

Maschinelle Übersetzung – Gegenwart und Perspektiven

Zur maschinellen Rekonstruktion natürlich-sprachlicher Dialoge

Räumliche Implikationen einer auf Wissen basierten Wirtschaftsentwicklung

Konstruktionsprinzipien für ein Lexikon in der maschinellen Sprachverarbeitung

Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora

Der Aufbau einer maßgeschneiderten XML-basierten Modellierung für ein Wörterbuchnetz

TEI-basierte Modellierung von Retrodigitalisaten (am Beispiel des Trierer Wörterbuchnetzes)

Zur Dokumentation und maschinellen Bearbeitung von Zeitungstexten in der Außenstelle Bonn

Internetbasierte Kommunikation als Textformen-basierte Interaktion: ein neuer Vorschlag zu einem alten Problem

Meta-computerlexikografische Bemerkungen zu Vernetzungen in XML-basierten Onlinewörterbüchern – am Beispiel von "elexiko"

Rechtschreibreform und maschinelle Sprachverarbeitung. Oder: Von der Unwahrscheinlichkeit, in Computern Liebe genossen zu haben

Determinantien und Pronomina unter dem Aspekt einer maschinellen Syntaxanalyse der deutschen Gegenwartssprache : zur syntaktischen Definition von Wortklassen

Maschinelle Übersetzung – Gegenwart und Perspektiven

Zur maschinellen Rekonstruktion natürlich-sprachlicher Dialoge

Räumliche Implikationen einer auf Wissen basierten Wirtschaftsentwicklung

Konstruktionsprinzipien für ein Lexikon in der maschinellen Sprachverarbeitung

Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora

Der Aufbau einer maßgeschneiderten XML-basierten Modellierung für ein Wörterbuchnetz

TEI-basierte Modellierung von Retrodigitalisaten (am Beispiel des Trierer Wörterbuchnetzes)

Zur Dokumentation und maschinellen Bearbeitung von Zeitungstexten in der Außenstelle Bonn

Internetbasierte Kommunikation als Textformen-basierte Interaktion: ein neuer Vorschlag zu einem alten Problem

Meta-computerlexikografische Bemerkungen zu Vernetzungen in XML-basierten Onlinewörterbüchern – am Beispiel von "elexiko"

Rechtschreibreform und maschinelle Sprachverarbeitung. Oder: Von der Unwahrscheinlichkeit, in Computern Liebe genossen zu haben

Determinantien und Pronomina unter dem Aspekt einer maschinellen Syntaxanalyse der deutschen Gegenwartssprache : zur syntaktischen Definition von Wortklassen

Maschinelle Übersetzung – Gegenwart und Perspektiven

Zur maschinellen Rekonstruktion natürlich-sprachlicher Dialoge

Räumliche Implikationen einer auf Wissen basierten Wirtschaftsentwicklung

Konstruktionsprinzipien für ein Lexikon in der maschinellen Sprachverarbeitung

Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora

Der Aufbau einer maßgeschneiderten XML-basierten Modellierung für ein Wörterbuchnetz

TEI-basierte Modellierung von Retrodigitalisaten (am Beispiel des Trierer Wörterbuchnetzes)

Zur Dokumentation und maschinellen Bearbeitung von Zeitungstexten in der Außenstelle Bonn

Internetbasierte Kommunikation als Textformen-basierte Interaktion: ein neuer Vorschlag zu einem alten Problem

Meta-computerlexikografische Bemerkungen zu Vernetzungen in XML-basierten Onlinewörterbüchern – am Beispiel von "elexiko"

Rechtschreibreform und maschinelle Sprachverarbeitung. Oder: Von der Unwahrscheinlichkeit, in Computern Liebe genossen zu haben

Determinantien und Pronomina unter dem Aspekt einer maschinellen Syntaxanalyse der deutschen Gegenwartssprache : zur syntaktischen Definition von Wortklassen

Related objects

Reset password