Multi-level Fusion of Audio and Visual Features for Speaker Identification-Reference-Cited by-同舟云学术

Multi-level Fusion of Audio and Visual Features for Speaker Identification

Published:2005 Issue: Volume: Page:493-499
ISSN:0302-9743
Container-title:Advances in Biometrics
language:
Short-container-title:

Author:

Wu Zhiyong,Cai Lianhong,Meng Helen

Publisher

Springer Berlin Heidelberg

Link

http://link.springer.com/content/pdf/10.1007/11608288_66.pdf

Reference11 articles.

1. Senior, A., Neti, C., Maison, B.: On the use of visual information for improving audio-based speaker recognition. In: Proc. Audio-visual Speech Processing Conf., pp. 108–111 (1999)

2. Lecture Notes in Computer Science;A.V. Nefian,2003

3. Chibelushi, C.C., Deravi, F., Mason, J.S.D.: A review of speech-based bimodal recognition. IEEE Trans. Multimedia 4, 23–37 (2002)

4. Chibelushi, C.C., Mason, J.S.D., Deravi, F.: Feature-level data fusion for bimodal person recognition. In: Proc. 6th IEEE International Conf. Image Processing and its Applications., pp. 399–403. IEEE, Stevenage (1997)

5. Chatzis, V., Bors, A.G., Pitas, I.: Multimodal decision-level fusion for person authentication. IEEE Trans. Syst. Man Cybern. A 29, 674–680 (1999)

Cited by 16 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Multimodal Video Emotional Analysis of Time Features Alignment and Information Auxiliary Learning;2023 International Joint Conference on Neural Networks (IJCNN);2023-06-18

2. Multimodal Fast–Slow Neural Network for learning engagement evaluation;Data Technologies and Applications;2023-02-03

3. Audio-Visual Speaker Verification via Joint Cross-Attention;Speech and Computer;2023

4. A new multi-stream approach using acoustic and visual features for robust speech recognition system;Materials Today: Proceedings;2022

5. An Experimental Analysis of Different Approaches to Audio–Visual Speech Recognition and Lip-Reading;Proceedings of 15th International Conference on Electromechanics and Robotics "Zavalishin's Readings";2020-09-02