既然从一开始没有讲话文字转WAV音频