他们的志向是相同的文字转WAV音频