1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
|
# This module is autogenerated by build_short_name_to_treebank.py
# Please do not edit
SHORT_NAMES = {
'af_afribooms': 'UD_Afrikaans-AfriBooms',
'akk_pisandub': 'UD_Akkadian-PISANDUB',
'akk_riao': 'UD_Akkadian-RIAO',
'aqz_tudet': 'UD_Akuntsu-TuDeT',
'sq_tsa': 'UD_Albanian-TSA',
'am_att': 'UD_Amharic-ATT',
'grc_proiel': 'UD_Ancient_Greek-PROIEL',
'grc_perseus': 'UD_Ancient_Greek-Perseus',
'apu_ufpa': 'UD_Apurina-UFPA',
'ar_nyuad': 'UD_Arabic-NYUAD',
'ar_padt': 'UD_Arabic-PADT',
'ar_pud': 'UD_Arabic-PUD',
'hy_armtdp': 'UD_Armenian-ArmTDP',
'aii_as': 'UD_Assyrian-AS',
'bm_crb': 'UD_Bambara-CRB',
'eu_bdt': 'UD_Basque-BDT',
'bej_nsc': 'UD_Beja-NSC',
'be_hse': 'UD_Belarusian-HSE',
'bho_bhtb': 'UD_Bhojpuri-BHTB',
'br_keb': 'UD_Breton-KEB',
'bg_btb': 'UD_Bulgarian-BTB',
'bxr_bdt': 'UD_Buryat-BDT',
'yue_hk': 'UD_Cantonese-HK',
'ca_ancora': 'UD_Catalan-AnCora',
'zh-hant_cfl': 'UD_Chinese-CFL',
'zh-hant_gsd': 'UD_Chinese-GSD',
'zh_gsdsimp': 'UD_Chinese-GSDSimp',
'zh-hans_gsdsimp': 'UD_Chinese-GSDSimp',
'zh-hant_hk': 'UD_Chinese-HK',
'zh-hant_pud': 'UD_Chinese-PUD',
'ckt_hse': 'UD_Chukchi-HSE',
'lzh_kyoto': 'UD_Classical_Chinese-Kyoto',
'cop_scriptorium': 'UD_Coptic-Scriptorium',
'hr_set': 'UD_Croatian-SET',
'cs_cac': 'UD_Czech-CAC',
'cs_cltt': 'UD_Czech-CLTT',
'cs_fictree': 'UD_Czech-FicTree',
'cs_pdt': 'UD_Czech-PDT',
'cs_pud': 'UD_Czech-PUD',
'da_ddt': 'UD_Danish-DDT',
'nl_alpino': 'UD_Dutch-Alpino',
'nl_lassysmall': 'UD_Dutch-LassySmall',
'en_esl': 'UD_English-ESL',
'en_ewt': 'UD_English-EWT',
'en_gum': 'UD_English-GUM',
'en_gumreddit': 'UD_English-GUMReddit',
'en_lines': 'UD_English-LinES',
'en_pud': 'UD_English-PUD',
'en_partut': 'UD_English-ParTUT',
'en_pronouns': 'UD_English-Pronouns',
'myv_jr': 'UD_Erzya-JR',
'et_edt': 'UD_Estonian-EDT',
'et_ewt': 'UD_Estonian-EWT',
'fo_farpahc': 'UD_Faroese-FarPaHC',
'fo_oft': 'UD_Faroese-OFT',
'fi_ftb': 'UD_Finnish-FTB',
'fi_ood': 'UD_Finnish-OOD',
'fi_pud': 'UD_Finnish-PUD',
'fi_tdt': 'UD_Finnish-TDT',
'fr_fqb': 'UD_French-FQB',
'fr_ftb': 'UD_French-FTB',
'fr_gsd': 'UD_French-GSD',
'fr_pud': 'UD_French-PUD',
'fr_partut': 'UD_French-ParTUT',
'fr_sequoia': 'UD_French-Sequoia',
'fr_spoken': 'UD_French-Spoken',
'qfn_fame': 'UD_Frisian_Dutch-Fame',
'gl_ctg': 'UD_Galician-CTG',
'gl_treegal': 'UD_Galician-TreeGal',
'de_gsd': 'UD_German-GSD',
'de_hdt': 'UD_German-HDT',
'de_lit': 'UD_German-LIT',
'de_pud': 'UD_German-PUD',
'got_proiel': 'UD_Gothic-PROIEL',
'el_gdt': 'UD_Greek-GDT',
'gub_tudet': 'UD_Guajajara-TuDeT',
'he_htb': 'UD_Hebrew-HTB',
'hi_hdtb': 'UD_Hindi-HDTB',
'hi_pud': 'UD_Hindi-PUD',
'qhe_hiencs': 'UD_Hindi_English-HIENCS',
'hu_szeged': 'UD_Hungarian-Szeged',
'is_icepahc': 'UD_Icelandic-IcePaHC',
'is_modern': 'UD_Icelandic-Modern',
'is_pud': 'UD_Icelandic-PUD',
'id_csui': 'UD_Indonesian-CSUI',
'id_gsd': 'UD_Indonesian-GSD',
'id_pud': 'UD_Indonesian-PUD',
'ga_idt': 'UD_Irish-IDT',
'ga_twittirish': 'UD_Irish-TwittIrish',
'it_isdt': 'UD_Italian-ISDT',
'it_pud': 'UD_Italian-PUD',
'it_partut': 'UD_Italian-ParTUT',
'it_postwita': 'UD_Italian-PoSTWITA',
'it_twittiro': 'UD_Italian-TWITTIRO',
'it_vit': 'UD_Italian-VIT',
'it_valico': 'UD_Italian-Valico',
'ja_bccwj': 'UD_Japanese-BCCWJ',
'ja_gsd': 'UD_Japanese-GSD',
'ja_modern': 'UD_Japanese-Modern',
'ja_pud': 'UD_Japanese-PUD',
'urb_tudet': 'UD_Kaapor-TuDeT',
'xnr_kdtb': 'UD_Kangri-KDTB',
'krl_kkpp': 'UD_Karelian-KKPP',
'kk_ktb': 'UD_Kazakh-KTB',
'kfm_aha': 'UD_Khunsari-AHA',
'quc_iu': 'UD_Kiche-IU',
'koi_uh': 'UD_Komi_Permyak-UH',
'kpv_ikdp': 'UD_Komi_Zyrian-IKDP',
'kpv_lattice': 'UD_Komi_Zyrian-Lattice',
'ko_gsd': 'UD_Korean-GSD',
'ko_kaist': 'UD_Korean-Kaist',
'ko_pud': 'UD_Korean-PUD',
'kmr_mg': 'UD_Kurmanji-MG',
'la_ittb': 'UD_Latin-ITTB',
'la_llct': 'UD_Latin-LLCT',
'la_proiel': 'UD_Latin-PROIEL',
'la_perseus': 'UD_Latin-Perseus',
'la_udante': 'UD_Latin-UDante',
'lv_lvtb': 'UD_Latvian-LVTB',
'lt_alksnis': 'UD_Lithuanian-ALKSNIS',
'lt_hse': 'UD_Lithuanian-HSE',
'olo_kkpp': 'UD_Livvi-KKPP',
'nds_lsdc': 'UD_Low_Saxon-LSDC',
'mpu_tudet': 'UD_Makurap-TuDeT',
'mt_mudt': 'UD_Maltese-MUDT',
'gv_cadhan': 'UD_Manx-Cadhan',
'mr_ufal': 'UD_Marathi-UFAL',
'gun_dooley': 'UD_Mbya_Guarani-Dooley',
'gun_thomas': 'UD_Mbya_Guarani-Thomas',
'mdf_jr': 'UD_Moksha-JR',
'myu_tudet': 'UD_Munduruku-TuDeT',
'pcm_nsc': 'UD_Naija-NSC',
'nyq_aha': 'UD_Nayini-AHA',
'sme_giella': 'UD_North_Sami-Giella',
'nb_bokmaal': 'UD_Norwegian-Bokmaal',
'nn_nynorsk': 'UD_Norwegian-Nynorsk',
'nn_nynorsklia': 'UD_Norwegian-NynorskLIA',
'cu_proiel': 'UD_Old_Church_Slavonic-PROIEL',
'orv_rnc': 'UD_Old_East_Slavic-RNC',
'orv_torot': 'UD_Old_East_Slavic-TOROT',
'fro_srcmf': 'UD_Old_French-SRCMF',
'otk_tonqq': 'UD_Old_Turkish-Tonqq',
'fa_perdt': 'UD_Persian-PerDT',
'fa_seraji': 'UD_Persian-Seraji',
'pl_lfg': 'UD_Polish-LFG',
'pl_pdb': 'UD_Polish-PDB',
'pl_pud': 'UD_Polish-PUD',
'pt_bosque': 'UD_Portuguese-Bosque',
'pt_gsd': 'UD_Portuguese-GSD',
'pt_pud': 'UD_Portuguese-PUD',
'ro_art': 'UD_Romanian-ArT',
'ro_nonstandard': 'UD_Romanian-Nonstandard',
'ro_rrt': 'UD_Romanian-RRT',
'ro_simonero': 'UD_Romanian-SiMoNERo',
'ru_gsd': 'UD_Russian-GSD',
'ru_pud': 'UD_Russian-PUD',
'ru_syntagrus': 'UD_Russian-SynTagRus',
'ru_taiga': 'UD_Russian-Taiga',
'sa_ufal': 'UD_Sanskrit-UFAL',
'sa_vedic': 'UD_Sanskrit-Vedic',
'gd_arcosg': 'UD_Scottish_Gaelic-ARCOSG',
'sr_set': 'UD_Serbian-SET',
'sms_giellagas': 'UD_Skolt_Sami-Giellagas',
'sk_snk': 'UD_Slovak-SNK',
'sl_ssj': 'UD_Slovenian-SSJ',
'sl_sst': 'UD_Slovenian-SST',
'soi_aha': 'UD_Soi-AHA',
'ajp_madar': 'UD_South_Levantine_Arabic-MADAR',
'es_ancora': 'UD_Spanish-AnCora',
'es_gsd': 'UD_Spanish-GSD',
'es_pud': 'UD_Spanish-PUD',
'sv_lines': 'UD_Swedish-LinES',
'sv_pud': 'UD_Swedish-PUD',
'sv_talbanken': 'UD_Swedish-Talbanken',
'swl_sslc': 'UD_Swedish_Sign_Language-SSLC',
'gsw_uzh': 'UD_Swiss_German-UZH',
'tl_trg': 'UD_Tagalog-TRG',
'tl_ugnayan': 'UD_Tagalog-Ugnayan',
'ta_mwtt': 'UD_Tamil-MWTT',
'ta_ttb': 'UD_Tamil-TTB',
'te_mtg': 'UD_Telugu-MTG',
'th_pud': 'UD_Thai-PUD',
'tpn_tudet': 'UD_Tupinamba-TuDeT',
'tr_boun': 'UD_Turkish-BOUN',
'tr_framenet': 'UD_Turkish-FrameNet',
'tr_gb': 'UD_Turkish-GB',
'tr_imst': 'UD_Turkish-IMST',
'tr_kenet': 'UD_Turkish-Kenet',
'tr_pud': 'UD_Turkish-PUD',
'tr_penn': 'UD_Turkish-Penn',
'tr_tourism': 'UD_Turkish-Tourism',
'qtd_sagt': 'UD_Turkish_German-SAGT',
'uk_iu': 'UD_Ukrainian-IU',
'hsb_ufal': 'UD_Upper_Sorbian-UFAL',
'ur_udtb': 'UD_Urdu-UDTB',
'ug_udt': 'UD_Uyghur-UDT',
'vi_vtb': 'UD_Vietnamese-VTB',
'wbp_ufal': 'UD_Warlpiri-UFAL',
'cy_ccg': 'UD_Welsh-CCG',
'hyw_armtdp': 'UD_Western_Armenian-ArmTDP',
'wo_wtb': 'UD_Wolof-WTB',
'yo_ytb': 'UD_Yoruba-YTB',
'ess_sli': 'UD_Yupik-SLI',
}
def short_name_to_treebank(short_name):
return SHORT_NAMES[short_name]
|