不能用前世的理论去看待文字转WAV音频