有一些是他们根据已知的情况分析出来的文字转WAV音频