Speech recognition and intelligent translation under multimodal human–computer interaction system

zu Verbundenen Objekten

Abstract: The traditional translation robot is limited to the translation of single-mode text images and text videos, which has the problem of low translation accuracy. Therefore, speech recognition and intelligent translation in multimodal human–computer interaction (HCI) system are proposed. First, the network structure of speech recognition model in multi-channel HCI system is established, and the multi-head self-attention mechanism is constructed. Then, the artificial intelligence voice wake-up function is designed, and a multimodal machine translation model is constructed. On this basis, selective attention is added to obtain visual recognition of perceived text, and the decoder is used for multimodal gating fusion to realize the output of encoder translation results. Experimental results show that this method has high BLUE value and high translation accuracy.

Standort: Deutsche Nationalbibliothek Frankfurt am Main

Umfang: Online-Ressource

Sprache: Englisch

Erschienen in: Speech recognition and intelligent translation under multimodal human–computer interaction system ; volume:33 ; number:1 ; year:2024 ; extent:14
Journal of intelligent systems ; 33, Heft 1 (2024) (gesamt 14)

Urheber: Huang, Danhua
Xiang, Shuaiqiu

DOI: 10.1515/jisys-2023-0192

URN: urn:nbn:de:101:1-2409071652440.194184105618

Rechteinformation: Open Access; Der Zugriff auf das Objekt ist unbeschränkt möglich.

Letzte Aktualisierung: 15.08.2025, 07:27 MESZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Deutsche Nationalbibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Original beim Datenpartner anzeigen

Beteiligte

Huang, Danhua
Xiang, Shuaiqiu

Ähnliche Objekte (12)

Multimodal machine translation through visuals and speech

Intelligent support mechanisms in adaptable human-computer interfaces

Exploiting unconscious user signals in multimodal human-computer interaction

Incremental speech translation

Speech communication and multimodal interfaces

Modeling modality selection in multimodal human-computer interaction : extending automated usability evaluation tools for multimodal input

Konferenzschrift

Human-computer interaction, Pt. 3.. Towards mobile and intelligent interaction environments

Intelligent Vehicle Violation Detection System Under Human–Computer Interaction and Computer Vision

Multimodal human–computer interaction in interventional radiology and surgery: a systematic literature review

Hochschulschrift

Machine Translation of Spontaneous Speech

Hochschulschrift

Learning speech translation from interpretation

zweidimensionales bewegtes Bild

SpeakQL: Towards Speech-driven Multimodal Querying

Multimodal machine translation through visuals and speech

Intelligent support mechanisms in adaptable human-computer interfaces

Exploiting unconscious user signals in multimodal human-computer interaction

Incremental speech translation

Speech communication and multimodal interfaces

Modeling modality selection in multimodal human-computer interaction : extending automated usability evaluation tools for multimodal input

Konferenzschrift

Human-computer interaction, Pt. 3.. Towards mobile and intelligent interaction environments

Intelligent Vehicle Violation Detection System Under Human–Computer Interaction and Computer Vision

Multimodal human–computer interaction in interventional radiology and surgery: a systematic literature review

Hochschulschrift

Machine Translation of Spontaneous Speech

Hochschulschrift

Learning speech translation from interpretation

zweidimensionales bewegtes Bild

SpeakQL: Towards Speech-driven Multimodal Querying

Multimodal machine translation through visuals and speech

Intelligent support mechanisms in adaptable human-computer interfaces

Exploiting unconscious user signals in multimodal human-computer interaction

Incremental speech translation

Speech communication and multimodal interfaces

Modeling modality selection in multimodal human-computer interaction : extending automated usability evaluation tools for multimodal input

Konferenzschrift

Human-computer interaction, Pt. 3.. Towards mobile and intelligent interaction environments

Intelligent Vehicle Violation Detection System Under Human–Computer Interaction and Computer Vision

Multimodal human–computer interaction in interventional radiology and surgery: a systematic literature review

Hochschulschrift

Machine Translation of Spontaneous Speech

Hochschulschrift

Learning speech translation from interpretation

zweidimensionales bewegtes Bild

SpeakQL: Towards Speech-driven Multimodal Querying

Informationen zur Registrierung von Kultur- und Wissenseinrichtungen finden Sie hier.

Felder mit * müssen ausgefüllt werden.

Benutzername*

Bitte geben Sie Ihren Benutzernamen ein

E-Mail*

Bitte geben Sie Ihre E-Mail ein

Bitte füllen Sie dieses Feld nicht aus

Vorname

Nachname

Passwort*

Bitte geben Sie Ihr Passwort ein

Passwort bestätigen*

Bitte geben Sie das gleiche Passwort ein

Ich habe die Nutzungsbedingungen und die Datenschutzerklärung zur Erhebung persönlicher Daten gelesen und stimme ihnen zu. *

Dieses Feld ist ein Pflichtfeld.

Ich möchte den Newsletter der Deutschen Digitalen Bibliothek abonnieren. Siehe Informationen zum Newsletter-Abonnement.

Benutzerkonto angelegt

Ihr „Meine DDB“-Konto wurde erfolgreich angelegt. Bevor Sie sich in Ihrem Konto anmelden können, müssen Sie auf den Bestätigungslink in der Nachricht klicken, die wir gerade an die von Ihnen angegebene E-Mail-Adresse geschickt haben

Speech recognition and intelligent translation under multimodal human–computer interaction system

Angaben zum Objekt

Verweise und Beziehungen

Beteiligte, Orts- und Zeitangaben

Weitere Informationen

Datenpartner

Beteiligte

Ähnliche Objekte (12)

Multimodal machine translation through visuals and speech

Intelligent support mechanisms in adaptable human-computer interfaces

Exploiting unconscious user signals in multimodal human-computer interaction

Incremental speech translation

Speech communication and multimodal interfaces

Modeling modality selection in multimodal human-computer interaction : extending automated usability evaluation tools for multimodal input

Human-computer interaction, Pt. 3.. Towards mobile and intelligent interaction environments

Intelligent Vehicle Violation Detection System Under Human–Computer Interaction and Computer Vision

Multimodal human–computer interaction in interventional radiology and surgery: a systematic literature review

Machine Translation of Spontaneous Speech

Learning speech translation from interpretation

SpeakQL: Towards Speech-driven Multimodal Querying

Multimodal machine translation through visuals and speech

Intelligent support mechanisms in adaptable human-computer interfaces

Exploiting unconscious user signals in multimodal human-computer interaction

Incremental speech translation

Speech communication and multimodal interfaces

Modeling modality selection in multimodal human-computer interaction : extending automated usability evaluation tools for multimodal input

Human-computer interaction, Pt. 3.. Towards mobile and intelligent interaction environments

Intelligent Vehicle Violation Detection System Under Human–Computer Interaction and Computer Vision

Multimodal human–computer interaction in interventional radiology and surgery: a systematic literature review

Machine Translation of Spontaneous Speech

Learning speech translation from interpretation

SpeakQL: Towards Speech-driven Multimodal Querying

Multimodal machine translation through visuals and speech

Intelligent support mechanisms in adaptable human-computer interfaces

Exploiting unconscious user signals in multimodal human-computer interaction

Incremental speech translation

Speech communication and multimodal interfaces

Modeling modality selection in multimodal human-computer interaction : extending automated usability evaluation tools for multimodal input

Human-computer interaction, Pt. 3.. Towards mobile and intelligent interaction environments

Intelligent Vehicle Violation Detection System Under Human–Computer Interaction and Computer Vision

Multimodal human–computer interaction in interventional radiology and surgery: a systematic literature review

Machine Translation of Spontaneous Speech

Learning speech translation from interpretation

SpeakQL: Towards Speech-driven Multimodal Querying

Verbundene Objekte

Passwort zurücksetzen