我倒是觉得他这么做不完全是为了设计我们文字转WAV音频