📝 Publications

🎙 Speech Synthesis

Note: C=CONFERENCE, J=JOURNAL, P=PATENT, S=IN SUBMISSION, A=PREPRINT, *=EQUAL CONTRIBUTION

Under Review (Interspeech 2026)

[S.1] MamTra: A Hybrid Mamba-Transformer Backbone for Speech Synthesis

Tan Dat Nguyen, Sangmin Bae, Joon Son Chung, Ji-Hoon Kim.

Project page

ICASSP 2026

[C.9] SPADE: Structured Pruning and Adaptive Distillation for Efficient LLM-TTS

Tan Dat Nguyen, Jaehun Kim, Ji-Hoon Kim, Shukjae Choi, Youshin Lim, Joon Son Chung. ( Oral Presentation )

Demo page

ICASSP 2026

[C.8] MAGE: A Coarse-to-Fine Speech Enhancer with Masked Generative Model

The Hieu Pham *, Tan Dat Nguyen *, Phuong Thanh Tran, Joon Son Chung, Duc Dung Nguyen.

Live Demo

ICASSP 2025

Accelerating codec-based speech synthesis illustration

[C.7] Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding

Tan Dat Nguyen , Ji-Hoon Kim, Jeongsoo Choi, Shukjae Choi, Jinseok Park, Younglo Lee, Joon Son Chung+

Demo page

ICASSP 2025

[C.6] AdaptVC: High Quality Voice Conversion with Adaptive Learning

Jaehun Kim, Ji-Hoon Kim, Yeunju Choi, Tan Dat Nguyen, Seongkyu Mun, Joon Son Chung.

Demo page

ICASSP 2025

[C.5] VoiceDiT: Dual-Condition Diffusion Transformer for Environment-Aware Speech Synthesis

Jaemin Jung, Junseok Ahn, Chaeyoung Jung, Tan Dat Nguyen, Youngjoon Jang, Joon Son Chung.

Demo page

ICASSP 2024

[C.4] FreGrad: Lightweight and fast frequency-aware diffusion vocoder

Tan Dat Nguyen* , Ji-Hoon Kim*, Youngjoon Jang, Jaehun Kim, Joon Son Chung+ ( Oral Presentation )

Demo page

Preprint 2024

Placeholder cover for Wanna Hear Your Voice

[A.1] Wanna Hear Your Voice: Adaptive, Effective, and Language-Agnostic Approach in Voice Extraction

The Hieu Pham, Nguyen Tan Dat, Phuong Thanh Tran, Duc Dung Nguyen.

Live Demo

ICABDE 2021

[C.2] Calib-StyleSpeech: A Zero-shot Approach In Voice Cloning Of High Adaptive Text To Speech System With Imbalanced Dataset ( Oral Presentation )

Nguyen Tan Dat, Lam Quang Tuong, Nguyen Duc Dung

Demo page

NAFOSTED 2021

[C.3] A Linguistic-based Transfer Learning Approach for Low-resource Bahnar Text-to-Speech ( Oral Presentation )

Tan Dat Nguyen, Quang Tuong Lam, Duc Hao Do, Huu Thuc Cai, Hoang Suong Nguyen, Thanh Hung Vo, Duc Dung Nguyen.

Demo page

FICC 2022

Placeholder cover for instance-based transfer learning

[C.1] Instance-Based Transfer Learning Approach for Vietnamese Speech Synthesis with Very Low Resource

Tuong Q. Lam, Dung D. Nguyen, Dat T. Nguyen, Han K. Lam, Thuc H. Cai, Suong N. Hoang, Hao D. Do.

RIVF 2021

[National conference (Vietnam)] CNN-based Vietnamese Speech Synthesis with Limited Dataset

Lam Quang Tuong, Nguyen Tan Dat, Lam Kha Han, Do Duc Hao.

RIVF 2021

[National conference (Vietnam)] Instanced-based Transfer Learning for Vietnamese Speech Synthesis

Lam Quang Tuong, Nguyen Tan Dat, Do Duc Hao.