他的目标就是第三文字转WAV音频