Journal article | Zeitschriftenartikel

Métodos digitais e a memória acessada por APIs: desenvolvimento de ferramenta para extração de dados de portais jornalísticos a partir da WayBack Machine

We explore the possibility of automation of data collection from web pages, using the application of customized code built in Python programming language, with specific HTML syntax (Hypertext Markup Language) to locate and extract elements of interest as links, text and images. The automated data collection, also known as scraping is an increasingly common feature in journalism. From the access to the digital repository site www.web.archive.org, also known as WayBackMachine, we develop a proof of concept of an algorithm able to recover, list and offer basic tools of analysis of data collected from the various versions of newspaper portals in time series.

Weitere Titel
Digital methods and the memory accessed by APIs: development tool for extracting data from journalistic portals with the WayBack Machine
ISSN
2447-4266
Umfang
Seite(n): 23-41
Sprache
Portugiesisch
Anmerkungen
Status: Veröffentlichungsversion; begutachtet (peer reviewed)

Erschienen in
Revista Observatório, 1(2)

Thema
Publizistische Medien, Journalismus,Verlagswesen
Informationsmanagement, informationelle Prozesse, Informationsökonomie
Kommunikatorforschung, Journalismus
interaktive, elektronische Medien
Programmiersprache
Digitale Medien
Kommunikation
Automatisierung
Website
Journalismus
Datenspeicherung
Datenerfassung

Ereignis
Geistige Schöpfung
(wer)
Carneiro dos Santos, Marcio
Ereignis
Veröffentlichung
(wann)
2015

DOI
Letzte Aktualisierung
21.06.2024, 16:27 MESZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
GESIS - Leibniz-Institut für Sozialwissenschaften. Bibliothek Köln. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Zeitschriftenartikel

Beteiligte

  • Carneiro dos Santos, Marcio

Entstanden

  • 2015

Ähnliche Objekte (12)