我想通过这样的情景去考虑一些问题――就是在现实中文字转WAV音频