Problémy a výzvy aplikované statistiky

Dnešní datum: 23. 11. 2017   | Hlavní stránka | Seznam rubrik | Download | Weblinks |  
  Hlavní menukulatý roh
Hlavní stránka
Seznam témat
Download
Weblinks
Ankety

Rozšířené vyhledávání

  Tématakulatý roh
mínus 1. Abstrakty
mínus 2. Vizualizace
mínus 3. R
mínus 4. Informace
mínus 5. Připomínky
mínus 6. Ostatní

  Informacekulatý roh
Problémy a výzvy aplikované statistiky

2005
DL

  Představení semináře PAStkulatý roh
PASt vznikl(a) na podzim roku 2005 jako neformální, nepravidelný seminář o praktických problémech, jimž čelí statistika při aplikaci teoretických výsledků v reálném životě. Jeho duchovním otcem je Pavel Schlesinger, jenž tak přenesl své kuchyňské debaty s Martinem Betincem na akademickou půdu KPMS MFF UK pod křídla Zdeňka Hlávky. Počínaje LS 2005/2006 se seminář stal standardním předmětem vyučovaným na KPMS MFF UK.

Ačkoli PASt vznikla z iniciativy doktorandů, svým zaměřením a priori nevyžaduje "hluboké" teoretiké znalosti matematické statistiky, a je tudíž určena širokému statistickému publiku včetně studentů magisterského studia na KPMS MFF UK.

Hlavními tématy PAStí jsou "pokročilé" R (např. tvorba vlastních balíčků, R + C) a zpracování a vizualizace velkých dat. Seminář je však otevřen všem pastím, do nichž se statistik může chytit, a jakékoli návrhy příspěvků jsou vítány.

Pravidelné informace o programu jsou rozesílány do programového mailing listu, do kterého se přihlásíte posláním emailu na adresu past-program-subscribe@yahoogroups.com.

  Novinkykulatý roh
19.04.2017: Plán přednášek

3.5.2017 A. Drabinová: Detekce odlišného fungování položek pomocí rozšířené logistické regrese
19.4.2017 K. Lahodová, V. Kika: Analýza vlivu legálních podpůrných látek na výkonnost studentů
8.3.2017 Š. Rusá: Bayesovská analýza tříúrovňového modelu mediace

19.10.2016 Ž. Miklová: Data Science aneb prediktivní modelování v praxi
27.4.2016 M. Otava: Bayesovské metody ve farmaceutické výrobě
11.5.2016 K. Sovová: Statistická analýza hmotnostně spektrometrických dat v metabolomice – analýza dechu

18.02.2015: Kdy a kde
PASt se v současnosti koná značně nepravidelně v budově MFF UK v Karlíně (Sokolovská 83).

  Nejnovější příspěvkykulatý roh

1. Abstrakty

* Matúš Maciak: Change-points recovery in seroprevalence data using regularization approach

Vydáno dne 25. 03. 2014 (117 přečtení)

We point our attention to seroprevalence data collected in Belgium and we investigate it with respect to possible change-point occurrences. The main idea of our approach is to use different concepts of an L1-norm regularization. The main advantage of the case method is that it introduces a fully data-driven approach with no requirement on a prior knowledge of any kind. This is usually not true for classical methods used in such situations: other methods are either not fully automatic as they involve a kind of multiple stage estimation or, they require a prior knowledge for structural break (change-point) positions instead.

We propose various alternatives and a proper statistical inference with theoretical results is briefly discussed. Additionally, a finite sample performance is verified using some simulated examples.


Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

1. Abstrakty

* Tomáš Jurczyk: Grafické programování

Vydáno dne 26. 02. 2014 (116 přečtení)

Pokud chcete provádět stejné analýzy opakovaně, máte několik možností. První možností je manuálně stále dokola opakovat postup, který vede k cíli. Jistě lepší variantou je naprogramovat makro, které bude jednou naprogramovaný postup provádět automaticky. Tento seminář bude ukázkou relativně nového přístupu k programování a to tzv. grafického programování. Nejde o klasické psaní makra v programovacím jazyce, ale o logické napojování bloků (uzlů) za sebe grafickou metodou (přičemž jednotlivé bloky jsou již naprogramované celky programu, ve kterém grafické programování provádíte). Tento typ programování se stává populárním především proto, že není potřeba znát žádný programovací jazyk, výsledné "makro" je velmi přehledné, snadno editovatelné a pochopitelné i pro člověka, který makro neudělal. Vše bude ukázáno prakticky na reálných příkladech z praxe. Jakákoli debata o tomto stylu programování či o data miningu (se kterým se většinou modul pro tento styl práce dodává) je vítána.

Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

1. Abstrakty

* Tomáš Kalibera: Proč výpočty v R bývají pomalé a jak je zrychlovat

Vydáno dne 04. 10. 2013 (129 přečtení)

Přes značnou popularitu jazyka R jsou výpočty typicky řádově pomalejší než například v C/C++, pozorováná byla i stonásobná zpomalení. Nízká výkonnost je dána zejména dynamickými vlastnostmi jazyka v kombinaci se zastaralým běhovým prostředím, které je založeno na interpretaci byte-code téměř bez optimalizací. Sémantika jazyka R dále vyžaduje časté kopírování dat, což je samo a sobě časově náročné a též zatěžuje systém automatické správy paměti.

I ve stávajícím běhovém prostředí lze však programy napsané v R často zrychlit i bez přepisování do C/C++, jak bude ukázano na příkladě. Užitečnými nástroji jsou vestavěný profiler a systémový profiler, spolu se základní znalostí záludností jazyka a chování běhového prostředí. Někdy pomůže i nastavení běhového prostředí a volba systémových knihoven.

Výzkumné implementace běhového prostředí jazyka R se snaží o zrychlení na základě specializace kódu a dat a oddalování výpočtů, s využitím zkušeností s optimalizovanými běhovými prostředími pro jiné dynamické jazyky. Některé vlastnosti jazyka R, zejména líné vyhodnocování parametrů funkcí se side-effecty, jsou pak novou výzvou ve výzkumu překladačů a implementací jazyků.

Folie k přednášce (PDF)


Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

1. Abstrakty

* Jan Kalina: Testy hypotéz pro mnohorozměrná data

Vydáno dne 01. 03. 2013 (137 přečtení)

Prezentace je věnována problému nestrannosti testů hypotéz pro mnohorozměrná data. V literatuře byly popsány pořadové testy pro dvouvýběrový problém pro mnohorozměrná data, které však nejsou nestranné pro konečné rozsahy výběrů. Proto jsme navrhli několik testů, které jsou založeny na pořadích geometrických vzdáleností. Každý z testů je lokálně nejsilnější nestranný test proti specifické alternativě. Přitom jde o testy, které jsou nestranné pro konečné rozsahy výběrů proti široké třídě alternativ. Zmíníme také některé další testy hypotéz, které byly navrženy speciálně pro vysoce rozměrná data.

Jurečková J., Kalina J. (2012): Nonparametric multivariate rank tests and their unbiasedness. Bernoulli 18 (1), 229-251.


Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

1. Abstrakty

* Miriam Slezáková, Karel Jílek: Denná a sezónna variabilita koncentrácie radónu v ovzduší areálu SÚRO Praha

Vydáno dne 17. 10. 2012 (127 přečtení)

Pred viac než rokom bola vybudovaná v areáli SÚRO stanica na meranie vonkajšej koncentrácie radónu v rozsahu od prirodzeného pozadia až do havarijných dávok. Okrem merania radónu stanica slúži aj na meranie  meteorologických veličín (teplota, vlhkosť, rýchlosť a smer vetra, intenzita zrážok a atmosférický tlak). Stanica je nezávislá na vonkajšej elektrickej sieti a umožňuje ON-line bezdrátový prenos všetkých dát.

Témou prezentácie je štúdium variability vonkajšej koncentrácie radónu v závislosti na meteorologických veličinách počas obdobia jedného roku od začiatku septembra 2011 do konca augusta 2012. Je skúmaný aj vzťah radónu ku škodlivinám v ovzduší (prachové častice, oxidy dusíku, oxid siričitý) merané ČHMÚ v stanici vo Vršoviciach, ktorá je najbližšie k ústavu.


Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

1. Abstrakty

* Petr Novák: Odhady podnikových statistik na ČSÚ

Vydáno dne 04. 10. 2012 (142 přečtení)

Kromě často diskutovaných sociálních zjišťování a zpracovávání výsledků voleb zajišťuje Český statistický úřad i celou řadu podnikových šetření s různým záběrem i periodicitou. Vzhledem k velkému počtu sledovaných ukazatelů, vazeb mezi nimi a detailní stratifikační struktuře není vždy snadné aplikovat klasické metody odhadů úhrnů základního souboru z výběru pomocí převažování. V poslední době se ČSÚ při zpracovávání podnikových statistik přiklání k imputačním metodám, kdy se pro každou jednotku spočte odhad každého ukazatele zvlášť na základě tzv. superpopulačního modelu. Tento přístup umožňuje jednak zveřejňovat úhrny v libovolném dělení sledované populace a také snadněji počítat chyby odhadů při složitější struktuře stratifikace i postupném odhadování údajů.

Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

1. Abstrakty

* Patrícia Martinková: Analýzy přijímacích zkoušek na medicínu

Vydáno dne 14. 05. 2012 (155 přečtení)

Některé české lékařské fakulty v posledních letech přijímají velkou část studentů bez přijímaček, pouze na základě vynikajícího studijního prospěchu na střední škole a za splnění dalších kritérií. V prezentaci ukážeme výsledky různých statistických analýz dat z let 1999 až po současnost. Pohovoříme o samotných přijímacích testech a vlastnostech jednotlivých položek testů. Ukážeme, jak přijímačky, středoškolský prospěch a další proměnné předpovídají úspěšnost studia a zda jsou současná kritéria pro přijetí bez přijímaček opodstatněná. Diskutovány budou také důsledky současných kritérií pro přijetí.

Autor: Zdeněk Hlávka | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek

index | 8-14 | předchozí | následující | Celkem 67 článků

  Vstup pro autorykulatý roh
Uživatel:
Heslo:

  Kalendářkulatý roh
<<  Listopad  >>
PoÚtStČtSoNe
  1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30    

  Vyhledáváníkulatý roh

Hledej
v PASTi!