[TTS] TTS のサンプリング周波数・ビット深度

1. サンプリング周波数(Sampling Rate)
1秒間に「音を何回測るか」
を表す数字。
例:
サンプリング周波数 何を意味する? 用途
16,000 Hz (16kHz) 1秒に16,000回測る 音声AI・電話
22,050 Hz 1秒に22,050回測る 一般的なTTS
44,100 Hz (44.1kHz) CD音質 音楽・高音質TTS

2. ビット深度(Bit Depth)
1回の測定で、音の強さを何段階で記録するか
例:
ビット深度 段階数 特徴
16bit 65,536段階 CD音質・一般的
24bit 16,777,216段階 スタジオ品質
32bit 約40億段階 研究・高音質合成

TTSではどう使われる?
用途 サンプリング周波数 ビット深度
音声AI(STT/TTS) 16kHz 16bit
高音質TTS(商用) 22kHz〜48kHz 16bit or 24bit
音楽/歌声合成 44.1kHz or 48kHz 24bit