所以其言辞谈吐已经不能说是文字转WAV音频