Update README.md
Browse files
README.md
CHANGED
|
@@ -1,5 +1,126 @@
|
|
| 1 |
---
|
| 2 |
-
language:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 3 |
tags:
|
| 4 |
- translation
|
| 5 |
|
|
@@ -370,6 +491,16 @@ license: apache-2.0
|
|
| 370 |
|
| 371 |
- tags: ['translation']
|
| 372 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 373 |
- prepro: normalization + SentencePiece (spm32k,spm32k)
|
| 374 |
|
| 375 |
- url_model: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-mul/opus2m-2020-08-01.zip
|
|
@@ -406,8 +537,8 @@ license: apache-2.0
|
|
| 406 |
|
| 407 |
- helsinki_git_sha: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
|
| 408 |
|
| 409 |
-
- transformers_git_sha:
|
| 410 |
|
| 411 |
- port_machine: brutasse
|
| 412 |
|
| 413 |
-
- port_time: 2020-08-
|
|
|
|
| 1 |
---
|
| 2 |
+
language:
|
| 3 |
+
-en
|
| 4 |
+
-ca
|
| 5 |
+
-es
|
| 6 |
+
-os
|
| 7 |
+
-eo
|
| 8 |
+
-ro
|
| 9 |
+
-fy
|
| 10 |
+
-cy
|
| 11 |
+
-is
|
| 12 |
+
-lb
|
| 13 |
+
-su
|
| 14 |
+
-an
|
| 15 |
+
-sq
|
| 16 |
+
-fr
|
| 17 |
+
-ht
|
| 18 |
+
-rm
|
| 19 |
+
-cv
|
| 20 |
+
-ig
|
| 21 |
+
-am
|
| 22 |
+
-eu
|
| 23 |
+
-tr
|
| 24 |
+
-ps
|
| 25 |
+
-af
|
| 26 |
+
-ny
|
| 27 |
+
-ch
|
| 28 |
+
-uk
|
| 29 |
+
-sl
|
| 30 |
+
-lt
|
| 31 |
+
-tk
|
| 32 |
+
-sg
|
| 33 |
+
-ar
|
| 34 |
+
-lg
|
| 35 |
+
-bg
|
| 36 |
+
-be
|
| 37 |
+
-ka
|
| 38 |
+
-gd
|
| 39 |
+
-ja
|
| 40 |
+
-si
|
| 41 |
+
-br
|
| 42 |
+
-mh
|
| 43 |
+
-km
|
| 44 |
+
-th
|
| 45 |
+
-ty
|
| 46 |
+
-rw
|
| 47 |
+
-te
|
| 48 |
+
-mk
|
| 49 |
+
-or
|
| 50 |
+
-wo
|
| 51 |
+
-kl
|
| 52 |
+
-mr
|
| 53 |
+
-ru
|
| 54 |
+
-yo
|
| 55 |
+
-hu
|
| 56 |
+
-fo
|
| 57 |
+
-zh
|
| 58 |
+
-ti
|
| 59 |
+
-co
|
| 60 |
+
-ee
|
| 61 |
+
-oc
|
| 62 |
+
-sn
|
| 63 |
+
-mt
|
| 64 |
+
-ts
|
| 65 |
+
-pl
|
| 66 |
+
-gl
|
| 67 |
+
-nb
|
| 68 |
+
-bn
|
| 69 |
+
-tt
|
| 70 |
+
-bo
|
| 71 |
+
-lo
|
| 72 |
+
-id
|
| 73 |
+
-gn
|
| 74 |
+
-nv
|
| 75 |
+
-hy
|
| 76 |
+
-kn
|
| 77 |
+
-to
|
| 78 |
+
-io
|
| 79 |
+
-so
|
| 80 |
+
-vi
|
| 81 |
+
-da
|
| 82 |
+
-fj
|
| 83 |
+
-gv
|
| 84 |
+
-sm
|
| 85 |
+
-nl
|
| 86 |
+
-mi
|
| 87 |
+
-pt
|
| 88 |
+
-hi
|
| 89 |
+
-se
|
| 90 |
+
-as
|
| 91 |
+
-ta
|
| 92 |
+
-et
|
| 93 |
+
-kw
|
| 94 |
+
-ga
|
| 95 |
+
-sv
|
| 96 |
+
-ln
|
| 97 |
+
-na
|
| 98 |
+
-mn
|
| 99 |
+
-gu
|
| 100 |
+
-wa
|
| 101 |
+
-lv
|
| 102 |
+
-jv
|
| 103 |
+
-el
|
| 104 |
+
-my
|
| 105 |
+
-ba
|
| 106 |
+
-it
|
| 107 |
+
-hr
|
| 108 |
+
-ur
|
| 109 |
+
-ce
|
| 110 |
+
-nn
|
| 111 |
+
-fi
|
| 112 |
+
-mg
|
| 113 |
+
-rn
|
| 114 |
+
-xh
|
| 115 |
+
-ab
|
| 116 |
+
-de
|
| 117 |
+
-cs
|
| 118 |
+
-he
|
| 119 |
+
-zu
|
| 120 |
+
-yi
|
| 121 |
+
-ml
|
| 122 |
+
-mul
|
| 123 |
+
|
| 124 |
tags:
|
| 125 |
- translation
|
| 126 |
|
|
|
|
| 491 |
|
| 492 |
- tags: ['translation']
|
| 493 |
|
| 494 |
+
- languages: ['en', 'ca', 'es', 'os', 'eo', 'ro', 'fy', 'cy', 'is', 'lb', 'su', 'an', 'sq', 'fr', 'ht', 'rm', 'cv', 'ig', 'am', 'eu', 'tr', 'ps', 'af', 'ny', 'ch', 'uk', 'sl', 'lt', 'tk', 'sg', 'ar', 'lg', 'bg', 'be', 'ka', 'gd', 'ja', 'si', 'br', 'mh', 'km', 'th', 'ty', 'rw', 'te', 'mk', 'or', 'wo', 'kl', 'mr', 'ru', 'yo', 'hu', 'fo', 'zh', 'ti', 'co', 'ee', 'oc', 'sn', 'mt', 'ts', 'pl', 'gl', 'nb', 'bn', 'tt', 'bo', 'lo', 'id', 'gn', 'nv', 'hy', 'kn', 'to', 'io', 'so', 'vi', 'da', 'fj', 'gv', 'sm', 'nl', 'mi', 'pt', 'hi', 'se', 'as', 'ta', 'et', 'kw', 'ga', 'sv', 'ln', 'na', 'mn', 'gu', 'wa', 'lv', 'jv', 'el', 'my', 'ba', 'it', 'hr', 'ur', 'ce', 'nn', 'fi', 'mg', 'rn', 'xh', 'ab', 'de', 'cs', 'he', 'zu', 'yi', 'ml', 'mul']
|
| 495 |
+
|
| 496 |
+
- src_constituents: {'eng'}
|
| 497 |
+
|
| 498 |
+
- tgt_constituents: {'sjn_Latn', 'cat', 'nan', 'spa', 'ile_Latn', 'pap', 'mwl', 'uzb_Latn', 'mww', 'hil', 'lij', 'avk_Latn', 'lad_Latn', 'lat_Latn', 'bos_Latn', 'oss', 'epo', 'ron', 'fry', 'cym', 'toi_Latn', 'awa', 'swg', 'zsm_Latn', 'zho_Hant', 'gcf_Latn', 'uzb_Cyrl', 'isl', 'lfn_Latn', 'shs_Latn', 'nov_Latn', 'bho', 'ltz', 'lzh', 'kur_Latn', 'sun', 'arg', 'pes_Thaa', 'sqi', 'uig_Arab', 'csb_Latn', 'fra', 'hat', 'liv_Latn', 'non_Latn', 'sco', 'cmn_Hans', 'pnb', 'roh', 'chv', 'ibo', 'bul_Latn', 'amh', 'lfn_Cyrl', 'eus', 'fkv_Latn', 'tur', 'pus', 'afr', 'brx_Latn', 'nya', 'acm', 'ota_Latn', 'cha', 'ukr', 'xal', 'slv', 'lit', 'zho_Hans', 'tmw_Latn', 'kjh', 'ota_Arab', 'war', 'tuk', 'sag', 'myv', 'hsb', 'lzh_Hans', 'ara', 'tly_Latn', 'lug', 'brx', 'bul', 'bel', 'vol_Latn', 'kat', 'gan', 'got_Goth', 'vro', 'ext', 'afh_Latn', 'gla', 'jpn', 'udm', 'mai', 'ary', 'sin', 'tvl', 'hif_Latn', 'cjy_Hant', 'bre', 'ceb', 'mah', 'nob_Hebr', 'crh_Latn', 'prg_Latn', 'khm', 'ang_Latn', 'tha', 'tah', 'tzl', 'aln', 'kin', 'tel', 'ady', 'mkd', 'ori', 'wol', 'aze_Latn', 'jbo', 'niu', 'kal', 'mar', 'vie_Hani', 'arz', 'yue', 'kha', 'san_Deva', 'jbo_Latn', 'gos', 'hau_Latn', 'rus', 'quc', 'cmn', 'yor', 'hun', 'uig_Cyrl', 'fao', 'mnw', 'zho', 'orv_Cyrl', 'iba', 'bel_Latn', 'tir', 'afb', 'crh', 'mic', 'cos', 'swh', 'sah', 'krl', 'ewe', 'apc', 'zza', 'chr', 'grc_Grek', 'tpw_Latn', 'oci', 'mfe', 'sna', 'kir_Cyrl', 'tat_Latn', 'gom', 'ido_Latn', 'sgs', 'pau', 'tgk_Cyrl', 'nog', 'mlt', 'pdc', 'tso', 'srp_Cyrl', 'pol', 'ast', 'glg', 'pms', 'fuc', 'nob', 'qya', 'ben', 'tat', 'kab', 'min', 'srp_Latn', 'wuu', 'dtp', 'jbo_Cyrl', 'tet', 'bod', 'yue_Hans', 'zlm_Latn', 'lao', 'ind', 'grn', 'nav', 'kaz_Cyrl', 'rom', 'hye', 'kan', 'ton', 'ido', 'mhr', 'scn', 'som', 'rif_Latn', 'vie', 'enm_Latn', 'lmo', 'npi', 'pes', 'dan', 'fij', 'ina_Latn', 'cjy_Hans', 'jdt_Cyrl', 'gsw', 'glv', 'khm_Latn', 'smo', 'umb', 'sma', 'gil', 'nld', 'snd_Arab', 'arq', 'mri', 'kur_Arab', 'por', 'hin', 'shy_Latn', 'sme', 'rap', 'tyv', 'dsb', 'moh', 'asm', 'lad', 'yue_Hant', 'kpv', 'tam', 'est', 'frm_Latn', 'hoc_Latn', 'bam_Latn', 'kek_Latn', 'ksh', 'tlh_Latn', 'ltg', 'pan_Guru', 'hnj_Latn', 'cor', 'gle', 'swe', 'lin', 'qya_Latn', 'kum', 'mad', 'cmn_Hant', 'fuv', 'nau', 'mon', 'akl_Latn', 'guj', 'kaz_Latn', 'wln', 'tuk_Latn', 'jav_Java', 'lav', 'jav', 'ell', 'frr', 'mya', 'bak', 'rue', 'ita', 'hrv', 'izh', 'ilo', 'dws_Latn', 'urd', 'stq', 'tat_Arab', 'haw', 'che', 'pag', 'nno', 'fin', 'mlg', 'ppl_Latn', 'run', 'xho', 'abk', 'deu', 'hoc', 'lkt', 'lld_Latn', 'tzl_Latn', 'mdf', 'ike_Latn', 'ces', 'ldn_Latn', 'egl', 'heb', 'vec', 'zul', 'max_Latn', 'pes_Latn', 'yid', 'mal', 'nds'}
|
| 499 |
+
|
| 500 |
+
- src_multilingual: False
|
| 501 |
+
|
| 502 |
+
- tgt_multilingual: True
|
| 503 |
+
|
| 504 |
- prepro: normalization + SentencePiece (spm32k,spm32k)
|
| 505 |
|
| 506 |
- url_model: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-mul/opus2m-2020-08-01.zip
|
|
|
|
| 537 |
|
| 538 |
- helsinki_git_sha: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
|
| 539 |
|
| 540 |
+
- transformers_git_sha: 6bdf998dffa70030e42f512a586f33a15e648edd
|
| 541 |
|
| 542 |
- port_machine: brutasse
|
| 543 |
|
| 544 |
+
- port_time: 2020-08-19-00:09
|