Welcome to mirror list, hosted at ThFree Co, Russian Federation.

short_name_to_treebank.py « common « models « stanza - github.com/stanfordnlp/stanza.git - Unnamed repository; edit this file 'description' to name the repository.
summaryrefslogtreecommitdiff
blob: 871f58da2cdd794047dbf3366e33f8745fa2ebe1 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
# This module is autogenerated by build_short_name_to_treebank.py
# Please do not edit

SHORT_NAMES = {
    'af_afribooms': 'UD_Afrikaans-AfriBooms',
    'akk_pisandub': 'UD_Akkadian-PISANDUB',
    'akk_riao': 'UD_Akkadian-RIAO',
    'aqz_tudet': 'UD_Akuntsu-TuDeT',
    'sq_tsa': 'UD_Albanian-TSA',
    'am_att': 'UD_Amharic-ATT',
    'grc_proiel': 'UD_Ancient_Greek-PROIEL',
    'grc_perseus': 'UD_Ancient_Greek-Perseus',
    'apu_ufpa': 'UD_Apurina-UFPA',
    'ar_nyuad': 'UD_Arabic-NYUAD',
    'ar_padt': 'UD_Arabic-PADT',
    'ar_pud': 'UD_Arabic-PUD',
    'hy_armtdp': 'UD_Armenian-ArmTDP',
    'aii_as': 'UD_Assyrian-AS',
    'bm_crb': 'UD_Bambara-CRB',
    'eu_bdt': 'UD_Basque-BDT',
    'bej_nsc': 'UD_Beja-NSC',
    'be_hse': 'UD_Belarusian-HSE',
    'bho_bhtb': 'UD_Bhojpuri-BHTB',
    'br_keb': 'UD_Breton-KEB',
    'bg_btb': 'UD_Bulgarian-BTB',
    'bxr_bdt': 'UD_Buryat-BDT',
    'yue_hk': 'UD_Cantonese-HK',
    'ca_ancora': 'UD_Catalan-AnCora',
    'zh-hant_cfl': 'UD_Chinese-CFL',
    'zh-hant_gsd': 'UD_Chinese-GSD',
    'zh_gsdsimp': 'UD_Chinese-GSDSimp',
    'zh-hans_gsdsimp': 'UD_Chinese-GSDSimp',
    'zh-hant_hk': 'UD_Chinese-HK',
    'zh-hant_pud': 'UD_Chinese-PUD',
    'ckt_hse': 'UD_Chukchi-HSE',
    'lzh_kyoto': 'UD_Classical_Chinese-Kyoto',
    'cop_scriptorium': 'UD_Coptic-Scriptorium',
    'hr_set': 'UD_Croatian-SET',
    'cs_cac': 'UD_Czech-CAC',
    'cs_cltt': 'UD_Czech-CLTT',
    'cs_fictree': 'UD_Czech-FicTree',
    'cs_pdt': 'UD_Czech-PDT',
    'cs_pud': 'UD_Czech-PUD',
    'da_ddt': 'UD_Danish-DDT',
    'nl_alpino': 'UD_Dutch-Alpino',
    'nl_lassysmall': 'UD_Dutch-LassySmall',
    'en_esl': 'UD_English-ESL',
    'en_ewt': 'UD_English-EWT',
    'en_gum': 'UD_English-GUM',
    'en_gumreddit': 'UD_English-GUMReddit',
    'en_lines': 'UD_English-LinES',
    'en_pud': 'UD_English-PUD',
    'en_partut': 'UD_English-ParTUT',
    'en_pronouns': 'UD_English-Pronouns',
    'myv_jr': 'UD_Erzya-JR',
    'et_edt': 'UD_Estonian-EDT',
    'et_ewt': 'UD_Estonian-EWT',
    'fo_farpahc': 'UD_Faroese-FarPaHC',
    'fo_oft': 'UD_Faroese-OFT',
    'fi_ftb': 'UD_Finnish-FTB',
    'fi_ood': 'UD_Finnish-OOD',
    'fi_pud': 'UD_Finnish-PUD',
    'fi_tdt': 'UD_Finnish-TDT',
    'fr_fqb': 'UD_French-FQB',
    'fr_ftb': 'UD_French-FTB',
    'fr_gsd': 'UD_French-GSD',
    'fr_pud': 'UD_French-PUD',
    'fr_partut': 'UD_French-ParTUT',
    'fr_sequoia': 'UD_French-Sequoia',
    'fr_spoken': 'UD_French-Spoken',
    'qfn_fame': 'UD_Frisian_Dutch-Fame',
    'gl_ctg': 'UD_Galician-CTG',
    'gl_treegal': 'UD_Galician-TreeGal',
    'de_gsd': 'UD_German-GSD',
    'de_hdt': 'UD_German-HDT',
    'de_lit': 'UD_German-LIT',
    'de_pud': 'UD_German-PUD',
    'got_proiel': 'UD_Gothic-PROIEL',
    'el_gdt': 'UD_Greek-GDT',
    'gub_tudet': 'UD_Guajajara-TuDeT',
    'he_htb': 'UD_Hebrew-HTB',
    'hi_hdtb': 'UD_Hindi-HDTB',
    'hi_pud': 'UD_Hindi-PUD',
    'qhe_hiencs': 'UD_Hindi_English-HIENCS',
    'hu_szeged': 'UD_Hungarian-Szeged',
    'is_icepahc': 'UD_Icelandic-IcePaHC',
    'is_modern': 'UD_Icelandic-Modern',
    'is_pud': 'UD_Icelandic-PUD',
    'id_csui': 'UD_Indonesian-CSUI',
    'id_gsd': 'UD_Indonesian-GSD',
    'id_pud': 'UD_Indonesian-PUD',
    'ga_idt': 'UD_Irish-IDT',
    'ga_twittirish': 'UD_Irish-TwittIrish',
    'it_isdt': 'UD_Italian-ISDT',
    'it_pud': 'UD_Italian-PUD',
    'it_partut': 'UD_Italian-ParTUT',
    'it_postwita': 'UD_Italian-PoSTWITA',
    'it_twittiro': 'UD_Italian-TWITTIRO',
    'it_vit': 'UD_Italian-VIT',
    'it_valico': 'UD_Italian-Valico',
    'ja_bccwj': 'UD_Japanese-BCCWJ',
    'ja_gsd': 'UD_Japanese-GSD',
    'ja_modern': 'UD_Japanese-Modern',
    'ja_pud': 'UD_Japanese-PUD',
    'urb_tudet': 'UD_Kaapor-TuDeT',
    'xnr_kdtb': 'UD_Kangri-KDTB',
    'krl_kkpp': 'UD_Karelian-KKPP',
    'kk_ktb': 'UD_Kazakh-KTB',
    'kfm_aha': 'UD_Khunsari-AHA',
    'quc_iu': 'UD_Kiche-IU',
    'koi_uh': 'UD_Komi_Permyak-UH',
    'kpv_ikdp': 'UD_Komi_Zyrian-IKDP',
    'kpv_lattice': 'UD_Komi_Zyrian-Lattice',
    'ko_gsd': 'UD_Korean-GSD',
    'ko_kaist': 'UD_Korean-Kaist',
    'ko_pud': 'UD_Korean-PUD',
    'kmr_mg': 'UD_Kurmanji-MG',
    'la_ittb': 'UD_Latin-ITTB',
    'la_llct': 'UD_Latin-LLCT',
    'la_proiel': 'UD_Latin-PROIEL',
    'la_perseus': 'UD_Latin-Perseus',
    'la_udante': 'UD_Latin-UDante',
    'lv_lvtb': 'UD_Latvian-LVTB',
    'lt_alksnis': 'UD_Lithuanian-ALKSNIS',
    'lt_hse': 'UD_Lithuanian-HSE',
    'olo_kkpp': 'UD_Livvi-KKPP',
    'nds_lsdc': 'UD_Low_Saxon-LSDC',
    'mpu_tudet': 'UD_Makurap-TuDeT',
    'mt_mudt': 'UD_Maltese-MUDT',
    'gv_cadhan': 'UD_Manx-Cadhan',
    'mr_ufal': 'UD_Marathi-UFAL',
    'gun_dooley': 'UD_Mbya_Guarani-Dooley',
    'gun_thomas': 'UD_Mbya_Guarani-Thomas',
    'mdf_jr': 'UD_Moksha-JR',
    'myu_tudet': 'UD_Munduruku-TuDeT',
    'pcm_nsc': 'UD_Naija-NSC',
    'nyq_aha': 'UD_Nayini-AHA',
    'sme_giella': 'UD_North_Sami-Giella',
    'nb_bokmaal': 'UD_Norwegian-Bokmaal',
    'nn_nynorsk': 'UD_Norwegian-Nynorsk',
    'nn_nynorsklia': 'UD_Norwegian-NynorskLIA',
    'cu_proiel': 'UD_Old_Church_Slavonic-PROIEL',
    'orv_rnc': 'UD_Old_East_Slavic-RNC',
    'orv_torot': 'UD_Old_East_Slavic-TOROT',
    'fro_srcmf': 'UD_Old_French-SRCMF',
    'otk_tonqq': 'UD_Old_Turkish-Tonqq',
    'fa_perdt': 'UD_Persian-PerDT',
    'fa_seraji': 'UD_Persian-Seraji',
    'pl_lfg': 'UD_Polish-LFG',
    'pl_pdb': 'UD_Polish-PDB',
    'pl_pud': 'UD_Polish-PUD',
    'pt_bosque': 'UD_Portuguese-Bosque',
    'pt_gsd': 'UD_Portuguese-GSD',
    'pt_pud': 'UD_Portuguese-PUD',
    'ro_art': 'UD_Romanian-ArT',
    'ro_nonstandard': 'UD_Romanian-Nonstandard',
    'ro_rrt': 'UD_Romanian-RRT',
    'ro_simonero': 'UD_Romanian-SiMoNERo',
    'ru_gsd': 'UD_Russian-GSD',
    'ru_pud': 'UD_Russian-PUD',
    'ru_syntagrus': 'UD_Russian-SynTagRus',
    'ru_taiga': 'UD_Russian-Taiga',
    'sa_ufal': 'UD_Sanskrit-UFAL',
    'sa_vedic': 'UD_Sanskrit-Vedic',
    'gd_arcosg': 'UD_Scottish_Gaelic-ARCOSG',
    'sr_set': 'UD_Serbian-SET',
    'sms_giellagas': 'UD_Skolt_Sami-Giellagas',
    'sk_snk': 'UD_Slovak-SNK',
    'sl_ssj': 'UD_Slovenian-SSJ',
    'sl_sst': 'UD_Slovenian-SST',
    'soi_aha': 'UD_Soi-AHA',
    'ajp_madar': 'UD_South_Levantine_Arabic-MADAR',
    'es_ancora': 'UD_Spanish-AnCora',
    'es_gsd': 'UD_Spanish-GSD',
    'es_pud': 'UD_Spanish-PUD',
    'sv_lines': 'UD_Swedish-LinES',
    'sv_pud': 'UD_Swedish-PUD',
    'sv_talbanken': 'UD_Swedish-Talbanken',
    'swl_sslc': 'UD_Swedish_Sign_Language-SSLC',
    'gsw_uzh': 'UD_Swiss_German-UZH',
    'tl_trg': 'UD_Tagalog-TRG',
    'tl_ugnayan': 'UD_Tagalog-Ugnayan',
    'ta_mwtt': 'UD_Tamil-MWTT',
    'ta_ttb': 'UD_Tamil-TTB',
    'te_mtg': 'UD_Telugu-MTG',
    'th_pud': 'UD_Thai-PUD',
    'tpn_tudet': 'UD_Tupinamba-TuDeT',
    'tr_boun': 'UD_Turkish-BOUN',
    'tr_framenet': 'UD_Turkish-FrameNet',
    'tr_gb': 'UD_Turkish-GB',
    'tr_imst': 'UD_Turkish-IMST',
    'tr_kenet': 'UD_Turkish-Kenet',
    'tr_pud': 'UD_Turkish-PUD',
    'tr_penn': 'UD_Turkish-Penn',
    'tr_tourism': 'UD_Turkish-Tourism',
    'qtd_sagt': 'UD_Turkish_German-SAGT',
    'uk_iu': 'UD_Ukrainian-IU',
    'hsb_ufal': 'UD_Upper_Sorbian-UFAL',
    'ur_udtb': 'UD_Urdu-UDTB',
    'ug_udt': 'UD_Uyghur-UDT',
    'vi_vtb': 'UD_Vietnamese-VTB',
    'wbp_ufal': 'UD_Warlpiri-UFAL',
    'cy_ccg': 'UD_Welsh-CCG',
    'hyw_armtdp': 'UD_Western_Armenian-ArmTDP',
    'wo_wtb': 'UD_Wolof-WTB',
    'yo_ytb': 'UD_Yoruba-YTB',
    'ess_sli': 'UD_Yupik-SLI',
}


def short_name_to_treebank(short_name):
    return SHORT_NAMES[short_name]