需要有人在旁边指引文字转WAV音频