而是他们听闻过文字转WAV音频