Zastosowanie danych scrapowanych w pomiarze dynamiki cen



Słowa kluczowe:

inflacja, CPI, web‑scraping, Jevons, Dutot, GEKS‑J, GEKS‑D, łańcuchowy Jevons, łańcuchowy Dutot, zakupy on‑line, big data


Web‑scraping to technika, którą można wykorzystać do automatycznego pozyskiwania danych zamieszczonych na stronach internetowych. Wraz ze wzrostem popularności zakupów on‑line coraz więcej sklepów i usługodawców zainwestowało w strony WWW z ofertą cenową. Przekłada się to na możliwość automatycznego ściągania przez badaczy cen detalistów z wielu branż, odzieżowej czy spożywczej. Wykorzystanie danych scrapowanych skutkuje nie tylko znaczącym obniżeniem kosztów badania cen, ale także poprawia precyzję szacunków inflacji i daje możliwość śledzenia jej w czasie rzeczywistym. Z tego względu web‑scraping jest dziś popularnym obiektem badań zarówno ośrodków statystycznych (Eurostat, brytyjski Office of National Statistics, belgijski Statbel), jak i uniwersytetów ( Billion Prices Project prowadzony w Massachusetts Institute of Technology). Zastosowanie danych scrapowanych do liczenia inflacji wiąże się jednak z wieloma wyzwaniami na poziomie ich zbierania, przetwarzania oraz agregacji. Celem artykułu jest zbadanie możliwości wykorzystania danych scrapowanych do analizy dynamiki cen zabawek, a w szczególności porównanie wyników uzyskanych za pomocą różnych formuł indeksowych. W opracowaniu przedstawiono wynik badania empirycznego na podstawie danych pochodzących z czterech sklepów (z 53 wybranych produktów sprzedawanych w Amazonie, Wallmarcie, Smarterkids oraz KBkids).


Balk B. M. (1995), Axiomatic Price Index Theory: A Survey, „International Statistical Reviews”, vol. 63, s. 69–93.


Białek J. (2019), Remarks on Geo‑Logarithmic Price Indices, „Journal of Official Statistics”, vol. 35, no. 2, s. 287–317.


Białek J., Bobel A. (2019), Comparison of Price Index Methods for the CPI Measurement Using Scanner Data, 16th Meeting of the Ottawa Group on Price Indices, Rio de Janeiro.


Cavallo A. (2013), Online vs Official Price Indexes: Measuring Argentina’s Inflation, „Journal of Monetary Economics”, vol. 60, no, 2, s. 152–165.


Cavallo A. (2017), Are Online and Offline Prices Similar? Evidence from Large Multi‑channel Retailers, „American Economic Review”, vol. 107, s. 283–303.


Cavallo A. (2018), Scraped Data and Sticky Prices, „The Review of Economics and Statistics”, vol. 100, s. 105–119.


Cavallo A., Rigobon R. (2016), The Billion Prices Project: Using Online Prices for Measurement and Research, „Journal of Economic Perspectives”, vol. 30, no. 2, s. 151–178.


Chessa A. G., Griffioen R. (2019), Comparing Price Indices of Clothing and Footwear for Scanner Data and Web Scraped Data, „Economics and Statistics: Big Data and Statistics”, no. 509, s. 49–69.


Consumer Price Index Manual. Theory and practice (2004), International Labour Office, Geneva.


Dutot C. F. (1738), Reflexions Politiques sur les Finances et le Commerce, vol. 1, Les Freres Vaillant et Nicolas Prevost, The Hague.


Eltetö Ö., Köves P. (1964), Egy nemzetközi összehasonlításoknál fellépő indexszámítási problémáról. On a Problem of Index Number Computation Relating to International Comparisons (in Hungarian), „Statisztikai Szemle”, no. 42, s. 507–518.


Eurostat, (dostęp: 10.02.2020).


Gini C. (1931), On the Circular Test of Index Numbers, „Metron”, no. 9, s. 3–24.


Ivancic L., Fox K. J., Diewert W. E. (2011), Scanner Data, Time Aggregation and the Construction of Price Indexes, „Journal of Econometrics”, vol. 151, s. 24–35.


Jevons W. (1865), The Coal Question, Macmillan & Co., London.


Lewel P. (2015), Is the Carli index flawed? Assessing the case for the new retail price index RPIJ, „Journal of the Royal Statistical Society Series A (Statistics in Society)”, vol. 178, no. 2, s. 303–336.


Lunnemann P., Wintr L. (2006), Are Internet Prices Sticky?, ECB Working Paper, no. 645.


Macias P., Stelmasiak D. (2018), Food inflation nowcasting with web scraped data, NBP Working Paper, no. 302.


Office for National Statistics (b.r.), ONS methodology working paper series number 12 – a comparison of index number methodology used on UK web scraped price data, (dostęp: 1.02.2020).


Office for National Statistics (2017), Research indices using web scraped price data: clothing data, (dostęp: 1.02.2020).


Radzikowski B., Śmietanka A. (2016), Online CASE CPI, First International Conference on Advanced Research Methods and Analytics, València.


Szulc B. (1964), Indices for Multiregional Comparisons, „Przegląd Statystyczny”, nr 3, s. 239–254.


Yang Z., Gan L., Tang F. (2010), A Study of Price Evolution in the Online Toy Market. Economics, „Open‑Assessment E‑Journal”, vol. 4, no. 28, s. 1–29.


Zhang L. (2020), Proxy expenditure weights for Consumer Price Index: audit sampling inference for big‑data statistics, „Journal of the Royal Statistical Society: Series A (Statistics in Society)”, (dostęp: 10.02.2020).





Jak cytować

Juszczak, A. (2021). Zastosowanie danych scrapowanych w pomiarze dynamiki cen. Acta Universitatis Lodziensis. Folia Oeconomica, 1(352), 25–37.




