但他却能够大概的猜到文字转WAV音频