mlaco.sk




Bicyklista na tento deň: Caki
Caki




Chceš dostáva novinky z tejto stránky priamo na svoj e-mail? Stačí zada adresu:







Náhodný vtip:
Pán hlavný prečo máte také malé rezne?
To je prosím optický klam. My sme totiŞ rozťírili jedåleň.

ďalší vtip

Vyber si kategóriu:
vseobecné, blondínky, počítače, sexuálne, ženy, škola, alkohol, hlody, múdrosti, zaujímavosti, všetky















Dnes je pondelok, 25. mája 2020.  Meniny má Urban


Úlohou tejto seminárnej práce je štatisticky analyzova návštevnos internetového servera www.masla.sk. Práca na predmet Štatistika B.
Na tejto stránke sa nenachádzajú tabužky, tie sú zozipovanom worde.
05/2000

[ZIP]
105 kb

Návštevnos servera

Úvod

Úlohou tejto seminárnej práce je štatisticky analyzova návštevnos 
internetového servera www.masla.sk. Tento server je zameraný hlavne na 
vyhžadávanie e-mailových adries žudí v Martine, ako aj na iných serveroch, 
ktoré sú ochotné poskytnú tieto informácie. Umožňuje vyhžadávanie v FTP 
archívoch umiestnených na sieti SANET. Ďalšou zaujímavou funkciou je 
počítadlo prístupov niektorých iných serveroch.

Zaznamenávané informácie o prístupoch za celú dobu sledovania prístupov 
na server www.masla.sk (sú uvedené v zdrojových tabužkách na konci práce) je 
potrebné podrobnejšie analyzova, aby vlastníci servera mali konkrétnejší 
prehžad, čo sa s návštevnosou ich servera deje.


Analýza prístupov v čase 

V zdrojovej tabužke č. 1 sa nachádzajú zdrojové údaje, z ktorých vychádza 
nasledovná analýza. Ide o denné údaje o prístupoch na server za posledných 70 
dní. Za prístupy budeme považova hodnotu Pagaviews. 

Niektoré elementárne charakteristiky sa nachádzajú vo výpočtovej 
tabužke č. 1.
Najmenší počet prístupov bol dňa 24.4.2000 s 130 prístupami, a naopak 
najúspešnejčí bol 3. apríl s 914 prístupmi, čo je rozdiel 784 prístupov.
Najväčší denný rast bol 22. marca 2000 (22), keď bol počet prístupov o 
152% vyšší oproti dňu predtým.
Za posledných 70 dní prístup priemerne klesali o približne 4 prístupov 
denne, čo znamená denný pokles 0,99-krát.

Najvhodnejšie vystihuje časový priebeh kvadratická funkcia, lebo pri nej je 
reziduálny rozptyl najmenší (22075.2). Lineárna funkcia sa jej pribižuje.


Data: SERVER.dn_prist                                               Percent: 100
Forecast summary                   M.E.    M.S.E.     M.A.E.  M.A.P.E.    M.P.E.
--------------------------------------------------------------------------------
544.216-4.03064*T                0.00000   22096.4   114.329   34.4256  -15.2350
554.965-4.92637*T+0.012616*T^2   0.00000   22075.2   113.714   34.1322  -15.1777
EXP(6.28108-0.0106317*T)         26.2436   22786.9   112.513   31.4526  -7.37701
EXP(5.83088+1.05403/T)           29.7933   27225.2   127.942   35.5420  -8.72873


y = 554.97 - 4.93*t + 0.013*t2

Z toho vyplýva že predpokladaný počet prístupov o mesiac, 11.júna 2000 
(t=102), je 188 prístupov.

Ako aj z obrázku 1 vyplýva, počet denných prístupov má za posledných 70 
dní klesajúci trend. 
Je to užitočná informácia pre správcov serveru. Ak chcú znova zvýši svoju 
popularitu, musia prinies v budúcom čase niečo nové, lebo záujem 
internetových surferov postupne opadáva.

Obrázok 1, kvadratický odhad trendu časového radu
Tabužka 1, elementárne charakteristiky časového radu prístupov Návštevnos a množstvo údajov Následne ide o skúmanie, či existuje závislos medzi počtom prístupov na server a množstvom prenesených údajov. Za počet prístupov budeme považova hodnotu Pageviews zo zdrojovej tabužky č. 2, kde sú uvedené hodnoty za posledných 30 mesiacov. Vtedy sa začali prístupy evidova. Hodnota Pageviews tomto prípade najlepšie vystihuje počet zobrazených internetových stránok zo servera www.masla.sk. Množstvo prenesených údajov je v tabužke zachytené pod hlavičkou Kbytes. Najprv treba zvoli vhodnú regresnú funkciu, ktorá najlepšie vystihuje závislos. Porovnaním koeficientu determinácie pri rôznych modeloch zistíme, že závislos celkom dobre vystihuje lineárna funkcia, ktorá vystihuje priebeh závislosti až na 85 percent. Okrem toho je vhodná aj pre jej jednoduchú interpretáciu. Významnos lineárneho regresného modelu je na hladine významnosti 0,05 potvrdená tým, že tabužková hodnota fischerovho rozdelenia je menšia ako testovacia charakteristika F. / 154.9 > 4.197 = F(0.95,1,28) / Regression Analysis - Linear model: Y = a+bX --------------------------------------------------------------------------- Dependent variable: SERVER.kbytes Independent variable: SERVER.pageviews --------------------------------------------------------------------------- Standard T Prob. Parameter Estimate Error Value Level --------------------------------------------------------------------------- Intercept -16774.9 31318.9 -0.535616 .59645 Slope 43.8173 3.52065 12.4458 .00000 --------------------------------------------------------------------------- Analysis of Variance --------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio Prob. Level Model 1.4744E0012 1 1.4744E0012 1.549E0002 .00000 Residual 2.6651E0011 28 9.5183E0009 --------------------------------------------------------------------------- Total (Corr.) 1.7409E0012 29 Correlation Coefficient = 0.920277 R-squared = 84.69 percent Stnd. Error of Est. = 97561.8 O počítačového výstupu vidie, že korelačný koeficient je na úrovni 0,92. To značí vežmi silnú kladnú závislos preneseného objemu dát od počtu prístupov. y = 43.8173x - 16774.9
Obrázok 2, závislos množstva dát od počtu prístupov
Z uvedeného vyplýva, že každý ďalší prístup na server znamená v priemere zvýšenie preneseného množstva dát o 43.81 Kb. Samotná lokujúca konštanta modelu v tomto prípade nemá vecnú interpretáciu. Dá sa predpoklada, že keby bol mesačný počet prístupov 30000, prenieslo by sa 1297744 Kb dát, teda približne 1,3 Gigabajtov. So spožahlivosou 98% sa dá tvrdi že ak sa zvýši počet prístupov o jeden, tak narastie množstvo prenesených dát v intervale od 35,1 Kb do 52,5 Kb. 98 percent confidence intervals for coefficient estimates -------------------------------------------------------------------------------- Estimate Standard error Lower Limit Upper Limit CONSTANT -16774.9 31318.9 -94059.0 60509.2 SERVER.pageviews 43.8173 3.52065 35.1296 52.5051 -------------------------------------------------------------------------------- A s pravdepodobnosou 98% môžeme tiež tvrdi, že ak budú mesačné prístupy na úrovni 4000, tak sa množstvo dát bude nachádza v intervale od 106 Mb do 211 Mb. 98% 98% Confidence Prediction Ind. variables Predictions lower upper lower upper SERVER.pagev -------------------------------------------------------------------------------- 158494.35748 105935.87464 211052.84032 -87924.42056 404913.13552 4000 Závislos browsera a rozlíšenia obrazovky K dispozícii sú v tabužke 2 údaje o používatežoch internetu pristupujúcich na server www.masla.sk. Niektorí používajú na prezeranie internetu program Microsoft Internet Explorer (IE) a iní majú radšej konkurenčný produkt Netscape Navigator (NN). Rozlíšenie obrazovky zväčša súvisí s vežkosou monitora. Ide o prevládajúci štandard 800x600 bodov a o väčšie, typické pre 17" monitory - 1024x768 bodov. Rozlíšenie obrazovky znamená, kožko bodov sa v danom režime monitora "zmestí" na obrazovku v horizontálnom a vertikálnom smere. Režim môže užívatež meni. Zjednodušene povedané, sú pri vyššom rozlíšení písmenka menšie. Preto sa väčšie rozlíšenia používajú najmä pri väčších monitoroch. Úlohou je zisti, či existuje medzi zvoleným rozlíšením a používaným programom závislos. Tieto informácie sú cenné pre tvorcov internetových stránok, ktorí musia robi stránky dobre zobrazitežné s programami a zároveň aj pod oboma rozlíšeniami. Tabužka 2, prehžad užívatežmi zvoleného browsera a rozlíšenia Na základe výsledkov je oprávnené tvrdenie, že s dostatočnou pravdepodobnosou 95% nie je závislos medzi zvoleným programom a rozlíšením. Je to preto, že vypočítaná štvorcová kontingencia (2.94264) je stále menšia ako tabužková hodnota H2(0.95,1) rozdelenia (3.842). Summary Statistics for Contingency Tables --------------------------------------------------------------------- Chi-square D.F. Significance --------------------------------------------------------------------- 2.94264 1 0.0862694 2.81745 1 0.0932442 with Yates correction With rows With columns Statistic Symmetric dependent dependent --------------------------------------------------------------------- Lambda 0.00000 0.00000 0.00000 Uncertainty Coeff. 0.00044 0.00042 0.00045 Somer's D -0.02098 -0.02217 -0.01991 Koefiecient korelácie (Somer's D) tiež poukazuje na vežmi nevýznamnú závislos.




www.mlaco.sk  ˇ  © Marek Laco 1998-2020  ˇ  mlaco@mlaco.sk