――而我们唯一知道的只是文字转WAV音频