ceyda
/

wav2vec2-large-xlsr-53-turkish

Automatic Speech Recognition

xlsr-fine-tuning-week

Model card Files Files and versions

ceyda commited on Mar 25, 2021

Commit

ed09082

·

1 Parent(s): d512767

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -43,8 +43,8 @@ from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 test_dataset = load_dataset("common_voice", "tr", split="test[:2%]")
-processor = Wav2Vec2Processor.from_pretrained("ceyda/wav2vec2-large-xlsr-turkish")
-model = Wav2Vec2ForCTC.from_pretrained("ceyda/wav2vec2-large-xlsr-turkish")
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
@@ -86,8 +86,8 @@ processor = Wav2Vec2Processor.from_pretrained("ceyda/wav2vec2-large-xlsr-turkish
 model = Wav2Vec2ForCTC.from_pretrained("ceyda/wav2vec2-large-xlsr-turkish")
 model.to("cuda")
-# chars_to_ignore_regex = '[\,\?\.\!\-\;\:\"\“]'
-chars_to_ignore_regex = '[\,\?\.\!\-\;\:\"\“\%\‘\”\�\'\`]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.

 test_dataset = load_dataset("common_voice", "tr", split="test[:2%]")
+processor = Wav2Vec2Processor.from_pretrained("ceyda/wav2vec2-large-xlsr-53-turkish")
+model = Wav2Vec2ForCTC.from_pretrained("ceyda/wav2vec2-large-xlsr-53-turkish")
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 model = Wav2Vec2ForCTC.from_pretrained("ceyda/wav2vec2-large-xlsr-turkish")
 model.to("cuda")
+# chars_to_ignore_regex = '[\\,\\?\\.\\!\\-\\;\\:\\"\\“]'
+chars_to_ignore_regex = '[\\,\\?\\.\\!\\-\\;\\:\\"\\“\\%\\‘\\”\\�\\'\\`]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.