只是开始初步融合的时候就有这样的意识文字转WAV音频