便完全的转化为了一种脸上的凝重文字转WAV音频