但在不破坏社交氛围的前提下只能顺从文字转WAV音频