虽然她知道答案毫无疑问是后者文字转WAV音频