Deep Neural Network Acoustic Model Baseline for Character-Level Transcription of Naturally Spoken Czech Language-Reference-Cited by-同舟云学术

Deep Neural Network Acoustic Model Baseline for Character-Level Transcription of Naturally Spoken Czech Language

Published:2020 Issue: Volume: Page:170-185
ISSN:2194-5357
Container-title:Software Engineering Perspectives in Intelligent Systems
language:
Short-container-title:

Author:

Vejvar Martin

Publisher

Springer International Publishing

Link

http://link.springer.com/content/pdf/10.1007/978-3-030-63322-6_14

Reference38 articles.

1. Nassif, A.B., Shahin, I., Attili, I., Azzeh, M., Shaalan, K.: Speech recognition using deep neural networks: a systematic review. IEEE Access. 7, 19143–19165 (2019). https://doi.org/10.1109/ACCESS.2019.2896880

2. Hannun, A., Case, C., Casper, J., Catanzaro, B., Diamos, G., Elsen, E., Prenger, R., Satheesh, S., Sengupta, S., Coates, A., Ng, A.Y.: Deep speech: Scaling up end-to-end speech recognition. ArXiv14125567 Cs. (2014)

3. Amodei, D., Anubhai, R., Battenberg, E., Case, C., Casper, J., Catanzaro, B., Chen, J., Chrzanowski, M., Coates, A., Diamos, G., Elsen, E., Engel, J., Fan, L., Fougner, C., Han, T., Hannun, A.Y., Jun, B., LeGresley, P., Lin, L., Narang, S., Ng, A.Y., Ozair, S., Prenger, R., Raiman, J., Satheesh, S., Seetapun, D., Sengupta, S., Wang, Y., Wang, Z., Wang, C., Xiao, B., Yogatama, D., Zhan, J., Zhu, Z.: Deep speech 2: end-to-end speech recognition in English and Mandarin. CoRR. abs/1512.02595 (2015)

4. Battenberg, E., Chen, J., Child, R., Coates, A., Li, Y.G.Y., Liu, H., Satheesh, S., Sriram, A., Zhu, Z.: Exploring neural transducers for end-to-end speech recognition. In: 2017 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), pp. 206–213. IEEE (2017)

5. Collobert, R., Puhrsch, C., Synnaeve, G.: Wav2Letter: an End-to-End ConvNet-based Speech Recognition System. CoRR. abs/1609.03193 (2016)