他把握的一个重要原则就是文字转WAV音频