首先是空气轻微的颤动文字转WAV音频