但是他的方法基本上是依靠个人的力量文字转WAV音频