Spaces:
Running
Running
Update README.md
Browse files
README.md
CHANGED
|
@@ -48,13 +48,14 @@ some onnx codes help english-tts
|
|
| 48 |
- 音素が揃っている大型モデル(Large/Huge)を単独でトレーニングすると、音質はいい。ただしイントネーションは怪しい
|
| 49 |
- 混ぜたり、Fine-Tuneするとイントーネーションはよくなるが、音質は悪くなる
|
| 50 |
- カリキュラム学習がうまくいっているのか、長文の分解で失敗しているのか不明
|
|
|
|
| 51 |
|
| 52 |
品質検出ツールがない
|
| 53 |
|
| 54 |
- ある程度トレーニングすると大抵CERは高品質。ただしCERは、たどたどしい、ゆっくりな日本語やRobotic音声にも、満点を与えるので、単独で評価できない
|
| 55 |
- Roboticな出力はMore-all 出力すればある程度わかります。(人間が聞く必要あるけど)
|
| 56 |
- 一部のコーパス出力でもイントネーションを比べることは出来ますが(人間が聞く必要あるけど) 完全なカバーではない。
|
| 57 |
-
|
| 58 |
### Phonemize
|
| 59 |
Tacorton2-Japanseにあるように、いろいろ変換方式ありますが、ブラウザーで使えないので検討中です。
|
| 60 |
|
|
|
|
| 48 |
- 音素が揃っている大型モデル(Large/Huge)を単独でトレーニングすると、音質はいい。ただしイントネーションは怪しい
|
| 49 |
- 混ぜたり、Fine-Tuneするとイントーネーションはよくなるが、音質は悪くなる
|
| 50 |
- カリキュラム学習がうまくいっているのか、長文の分解で失敗しているのか不明
|
| 51 |
+
- シンプルなPhonemizeでは難しいのでは考えています。英語までとはいわないが、センテンスで分割マークを入れたい(ブラウザーでも動く入れ方を検討中)
|
| 52 |
|
| 53 |
品質検出ツールがない
|
| 54 |
|
| 55 |
- ある程度トレーニングすると大抵CERは高品質。ただしCERは、たどたどしい、ゆっくりな日本語やRobotic音声にも、満点を与えるので、単独で評価できない
|
| 56 |
- Roboticな出力はMore-all 出力すればある程度わかります。(人間が聞く必要あるけど)
|
| 57 |
- 一部のコーパス出力でもイントネーションを比べることは出来ますが(人間が聞く必要あるけど) 完全なカバーではない。
|
| 58 |
+
|
| 59 |
### Phonemize
|
| 60 |
Tacorton2-Japanseにあるように、いろいろ変換方式ありますが、ブラウザーで使えないので検討中です。
|
| 61 |
|