就是将这两股意识融合在一起文字转WAV音频