他们用到的算法不是二进制的文字转WAV音频