表面上是说给所有人听的文字转WAV音频