根据他们之前的观察文字转WAV音频