在这个过程中他唯一需要做的文字转WAV音频