他肯定是按照这个思路设计的文字转WAV音频