Informace o projektu
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
(LINDAT-Clarin)
- Kód projektu
- LM2010013
- Období řešení
- 11/2010 - 12/2015
- Investor / Programový rámec / typ projektu
-
Ministerstvo školství, mládeže a tělovýchovy ČR
- Velké infrastruktury pro výzkum, vývoj a inovace
- Fakulta / Pracoviště MU
- Fakulta informatiky
- Spolupracující organizace
-
Ústav pro jazyk český AV ČR, v. v. i.
Univerzita Karlova
- Odpovědná osoba Ing. Jana Kalinová, Ph.D.
- Odpovědná osoba prof. Ing. Jan Tříska, CSc.
Projekt LINDAT-Clarin bude napojen na projekt Clarin, ESFRI projekt (FP7-RI-2122230) pro jazykovou infrastrukturu v humanitních vědách (Common Language Resources and Technology Infrastructure)
Uzel Clarin bude realizován čtyřmi partnery projektu. Toto ZSPO bude realizovat organizačně i technologicky veškeré funkce uzlu (Centrum "A" v terminologii Clarin) pro budoucí asociaci Clarin-ERIC, a bude pověřeno výkonem funkcí MŠMT v Clarin-ERIC (kromě pravomocí rozhodovacích). Navrhovaným sídlem této ZSPO je budova sekce informatiky MFF UK na Malostranském náměstí 25, 11800 Praha 1.
Národní úkoly při tvorbě a dodávání jazykových dat, úkoly vzdělávací a výzkumné budou plnit jednotlivé zakladatelské organizace v jejich stávající struktuře. Organizačně budou jednotlivá pracoviště podporovaná z prostředků LINDAT-Clarin oddělena v rámci těchto organizací.
Publikace
Počet publikací: 91
2012
-
Low-cost ontology development
6th International Global Wordnet Conference Proceedings, rok: 2012
-
Migrating Cornetto Lexicon to New XML Database Engine
6th International Global Wordnet Conference Proceedings, rok: 2012
-
POS Annotated 50M Corpus of Tajik Language
Proceedings of the Workshop on Language Technology for Normalisation of Less-Resourced Languages (SALTMIL 8/AfLaT 2012), rok: 2012
-
Recent Czech Web Corpora
6th Workshop on Recent Advances in Slavonic Natural Language Processing, rok: 2012
-
Saara: Anaphora Resolution on Free Text in Czech
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012, rok: 2012
-
SENEQA - System for Quality Testing of Wordnet Data
6th International Global Wordnet Conference Proceedings, rok: 2012
-
SpiderLing
Rok: 2012
-
Syntactic parser SET
Rok: 2012
-
Towards 100M Morphologically Annotated Corpus of Tajik
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012, rok: 2012
2011
-
Budování anotovaného korpusu bez odborníků
Korpusová lingvistika 2 - Výzkum a výstavba korpusů, rok: 2011