但在这里……他必须把文字转WAV音频