只能被动式地顺着情绪和思想释放文字转WAV音频