原来大约可以使用三四次次文字转WAV音频