所以基本的口语交流沒有问題文字转WAV音频