另一方面又强调文字转WAV音频