据说是几方权衡之下做出的决定文字转WAV音频