ucnk.ff.cuni.cz
Dostupné korpusy
http://ucnk.ff.cuni.cz/struktura.php
Korpusy psaného jazyka (synchronní). Spojení všech synchronních psaných korpusů řady SYN. Korpus publicistických textů z let 2005 - 2009. Žánrově vyvážený korpus, převažují texty z let 2005 - 2009. Korpus publicistických textů z let 1995 - 2007. Korpus publicistických textů z let 1989 - 2004. Žánrově vyvážený korpus, převažují texty z let 2000 - 2004. Žánrově vyvážený korpus, převažují texty z let 1990 - 1999. Upravený SYN2000, referenční zdroj Frekvenčního slovníku češtiny. Korpus diachronní složky ČNK.
ucnk.ff.cuni.cz
Krátké zprávy
http://ucnk.ff.cuni.cz/zpravy.php
Srdečně zveme na přednášky korpusového lingvisty Alana Partingtona. Které se uskuteční 3. a 4. května 2016. Úterý 3. 5. 2016 ve 14:10, Ústav Českého národního korpusu, Panská 7, místnost č. 5. Corpus-assisted Discourse Studies (CADS): Good Practices and Potential Pitfalls. Středa 4. 5. 2016 ve 13:00, hlavní budova FF UK. Why are you English all so anti-European? A corpus-assisted discourse study (CADS) of stay or leave? Arguments on the eve of the UK Referendum on withdrawal from the EU. Změny spočívají ...
wackybook.sslmit.unibo.it
Wacky! Acknowledgements
http://wackybook.sslmit.unibo.it/wackyacknowledge.html
Working papers on the Web as Corpus. The editors gratefully acknowledge the Fondazione Cassa dei Risparmi di Forlì for financial help in organizing the first Web as Corpus workshop. They also would like to thank the participants in the Web as Corpus workshops and in the online WaCky community. In particular, the contributors to this volume and Adam Kilgarriff - for very stimulating discussions. Cover image: Motoko Ueyama. Back to the main page.
sslmitdev-online.sslmit.unibo.it
SSLMIT Dev Online
http://sslmitdev-online.sslmit.unibo.it/wac/wac.php
Web as Corpus Home. Tools and Resources to use the web as a corpus. This page is under construction. Please refer to out WaCky wiki. For up-to-date information on the WaCky project. SSLMIT Dev Online Newsletter. 2004 SSLMIT (University of Bologna).
dev.sslmit.unibo.it
SSLMIT Dev Online
http://dev.sslmit.unibo.it/corpora/corpora.php
Welcome to the SSLMIT online corpora services. Here, we provide unified concordancer/ngram-frequency list interfaces to our corpora, using the IMS Corpus WorkBench. You can use this interface to explore "la Repubblica". If you're looking for our very large web-based corpora (deWaC, itWaC and ukWaC), check out the Wacky page. We are always glad to get feedback. SSLMIT Dev Online Newsletter. 2004 SSLMIT (University of Bologna).
dev.sslmit.unibo.it
SSLMIT Dev Online
http://dev.sslmit.unibo.it/wac/wac.php
Web as Corpus Home. Tools and Resources to use the web as a corpus. This page is under construction. Please refer to out WaCky wiki. For up-to-date information on the WaCky project. SSLMIT Dev Online Newsletter. 2004 SSLMIT (University of Bologna).
skalicka.ff.cuni.cz
Krátké zprávy
http://skalicka.ff.cuni.cz/zpravy.php
16 září 2016 byla zveřejněna verze 4. Jehož velikost po zahrnutí textů SYN2015 a dosud nezveřejněné publicistiky převážně z let 2010 2014 přesáhla 3,6 mld. slov. Dne 9 9. 2016 byla zveřejněna verze 9 paralelního korpusu InterCorp. Podrobnosti najdete na wiki ČNK. Srdečně zveme na přednášky korpusového lingvisty Alana Partingtona. Které se uskuteční 3. a 4. května 2016. Úterý 3. 5. 2016 ve 14:10, Ústav Českého národního korpusu, Panská 7, místnost č. 5. Why are you English all so anti-European? Pro nejlep...
corpusitaliano.it
Corpus Italiano
http://www.corpusitaliano.it/it/contents/description.html
Informazioni generali & download. Help pages / manuali. Il corpus PAISÀ è un'ampia collezione di testi in lingua italiana tratti dal web (ca. 380 000 documenti per ca. 250 milioni di token) protetti da licenze creative commons ( attribuzione - condividi allo stesso modo. E attribuzione - condividi allo stesso modo - non commerciale. E raccolti nell'ambito dell'omonimo progetto. I documenti presenti nel corpus PAISA sono stati selezionati utilizzando due criteri. Il primo, ispirato al progetto WaCky.
skalicka.ff.cuni.cz
Dostupné korpusy
http://skalicka.ff.cuni.cz/struktura.php
Korpusy psaného jazyka (synchronní). Spojení všech synchronních psaných korpusů řady SYN. Korpus publicistických textů z let 2005 - 2009. Žánrově vyvážený korpus, převažují texty z let 2005 - 2009. Korpus publicistických textů z let 1995 - 2007. Korpus publicistických textů z let 1989 - 2004. Žánrově vyvážený korpus, převažují texty z let 2000 - 2004. Žánrově vyvážený korpus, převažují texty z let 1990 - 1999. Upravený SYN2000, referenční zdroj Frekvenčního slovníku češtiny. Korpus diachronní složky ČNK.