他的目标是他们其中的一个文字转WAV音频