他认为演绎的成份多文字转WAV音频