这个由张东城提出的一个大概框架文字转WAV音频