Update README.md
Browse files
README.md
CHANGED
|
@@ -10,6 +10,10 @@ pipeline_tag: automatic-speech-recognition
|
|
| 10 |
### 模型简介
|
| 11 |
本模型是Whisper-medium的一个微调版本,用于对潮州话(潮汕话)的正字识别(并非翻译为普通话),微调的代码源自[夜雨飘零](https://github.com/yeyupiaoling/Whisper-Finetune/tree/master)大佬的github仓库。
|
| 12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 13 |
### 微调数据
|
| 14 |
微调训练的数据来源于[teochew-wild](https://huggingface.co/datasets/panlr/teochew_wild),这是首个开源的、野外的、正字准确标注的多说话人潮汕话数据集,包含约18.9小时、共12500条潮汕话音频片段,覆盖了潮州府城、汕头市区、潮安南部、澄海、榕江音等多种口音。
|
| 15 |
|
|
|
|
| 10 |
### 模型简介
|
| 11 |
本模型是Whisper-medium的一个微调版本,用于对潮州话(潮汕话)的正字识别(并非翻译为普通话),微调的代码源自[夜雨飘零](https://github.com/yeyupiaoling/Whisper-Finetune/tree/master)大佬的github仓库。
|
| 12 |
|
| 13 |
+
### 在线Demo
|
| 14 |
+
|
| 15 |
+
[teochew_whisper](https://huggingface.co/spaces/panlr/teochew_whisper)
|
| 16 |
+
|
| 17 |
### 微调数据
|
| 18 |
微调训练的数据来源于[teochew-wild](https://huggingface.co/datasets/panlr/teochew_wild),这是首个开源的、野外的、正字准确标注的多说话人潮汕话数据集,包含约18.9小时、共12500条潮汕话音频片段,覆盖了潮州府城、汕头市区、潮安南部、澄海、榕江音等多种口音。
|
| 19 |
|